Episodes
-
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Missing episodes?
-
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda
* IA ACT
* Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/
* From Silos to Standardization: Leveraging DBT for a Democratized Data Framework -> https://medium.com/uc-engineering/from-silos-to-standardization-leveraging-dbt-for-a-democratized-data-framework-f444dcd07cd9
* DuckDB vs Polars -> https://medium.com/gitconnected/duckdb-vs-polars-2ff19cc7af41
* Meetup Python sur les frameworks UI -> https://youtu.be/yspHNEFjKfQ?list=PLv7xGPH0RMUT1GSCGHJmqnswpk-nyz5aq
* NiceGUI -> https://nicegui.io
------------------
Cette publication est sponsorisée par Affini-Tech et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, ExpĂ©rimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog dâAffini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous Ă [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Shownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/
-
### Promptologues
* How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb
* Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua
### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/
* embedchain/embedchain: The Open Source RAG framework -> https://github.com/embedchain/embedchain
* A Guide to Large Language Model Abstractions - Two Sigma -> https://www.twosigma.com/articles/a-guide-to-large-language-model-abstractions/
### Data eng* How to Scale Your Data Pipelines and Data Products with Contract Testing and Dbt -> https://towardsdatascience.com/how-to-scale-your-data-pipelines-and-data-products-with-dbt-and-contract-testing-10c92ea9a443
* dbt Alternatives -> https://www.greenmountaindatasolutions.com/blog/alternatives-to-dbt-data-build-tool -
Shownotes sur :
https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/ -
Shownotes sur :
https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/ -
https://bigdatahebdo.com/podcast/episode-180-quelques-news-pour-demarrer-2024/
-
### LLM fever* [GAIC-fr] Analyse des annonces IA de MS Ignite -> https://www.youtube.com/watch?v=rJTcJHh6bcY
* LightOn annonce la seconde version dâAlfred, son modĂšle LLM open-source -> https://www.actuia.com/actualite/lighton-annonce-la-seconde-version-dalfred-son-modele-llm-open-source/
* Introducing Claude 2.1 -> https://www.anthropic.com/index/claude-2-1
* Welcome to the Hallucination Index! -> https://www.rungalileo.io/hallucinationindex
### data-engineering
* Multithreading Framework for Data Ingestion -> https://awstip.com/multithreading-framework-for-data-ingestion-3c3c8480b8d0
* Talend Open Studio c'est fini au 31/1/202 -> https://community.talend.com/s/question/0D55b00009OuDGPCA3/update-on-the-future-of-talend-open-studio?language=en_US
* MotherDuck: Making PySpark Code Faster with DuckDB -> https://motherduck.com/blog/making-pyspark-code-faster-with-duckdb
* How to Extract Data Observability Metrics from Snowflake Using SQL -> https://towardsdatascience.com/how-to-extract-data-observability-metrics-from-snowflake-using-sql-9bf001038788 -
### LLM fever
* Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123
* ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résult
ats -> https://generationia.flint.media/p/step-back-prompting-reculer-pour-mieux-sauter
* Microsoft optimise Azure avec ses propres puces dâIA -> https://www.actuia.com/actualite/microsoft-optimise-azure-avec-ses-propres-puces-dia/
### Data-eng
* data load tool (dlt) -> https://dlthub.com/
* Microsoft and Google join forces on OneTable, an open-source solution for data lake challenges -> https://venturebeat.com/data-infrastructure/exclusive-microsoft-and-google-join-forces-on-onetable-an-open-source-solution-for-data-lake-challenges/
------------------
Cette publication est sponsorisée par Affini-Tech et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, ExpĂ©rimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog dâAffini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous Ă [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
* Why can't datacenter operators stop thinking about atomic power? -> https://www.theregister.com/2023/09/27/datacenters_nuclear_power
### LLM fever* Evaluate LLMs and RAG a practical example using Langchain and Hugging Face -> https://www.philschmid.de/evaluate-llm
* Introducing the Giskard Bot: Enhancing LLM Testing & Debugging on Hugging Face -> https://huggingface.co/blog/JMJM/giskard-llm-testing-and-debugging-hf
* Introducing Canopy: An easy, free, and flexible RAG framework powered by Pinecone -> https://www.pinecone.io/blog/canopy-rag-framework/
### Tools* Pijul -> https://pijul.org/
* Pijul la théorie -> https://pijul.org/manual/theory.html
### meetup* "Ou va la modern Data Stack ?" le 31 janvier 2024 chez Criteo -> https://www.linkedin.com/company/modern-data-stack-france/
------------------
Cette publication est sponsorisée par Affini-Tech et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, ExpĂ©rimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog dâAffini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous Ă [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
* â ïž Don't try this at home: CSS _as_ the backend - introducing Cascading Server Sheets! -> https://dev.to/thormeier/dont-try-this-at-home-css-as-the-backend-what-3oih
### LLM fever
* Open AI Dev day 2024 -> https://openai.com/blog/new-models-and-developer-products-announced-at-devday
* Knowledge Distillation: Principles, Algorithms, Applications -> https://neptune.ai/blog/knowledge-distillation
* Quand la boßte noire des IA génératives livre ses secrets -> https://www.lexpress.fr/amp/economie/high-tech/quand-la-boite-noire-des-ia-generatives-livre-ses-secrets-BFUANKGCOZF2DDGJRNFDNAVHZU/
### Data-Science
* Hidden Markov Models Explained with a Real Life Example and Python code -> https://medium.com/towards-data-science/hidden-markov-models-explained-with-a-real-life-example-and-python-code-2df2a7956d65
### Data-eng
* Open Data Contract Standard -> https://github.com/bitol-io/open-data-contract-standard
* Twitterâs Owner Elon Musk refuses to pay Google Cloud Bill -> https://medium.com/codex/twitters-owner-elon-musk-refuses-to-pay-google-cloud-bill-8e0ec1030101 -
### Data-science
* XGBoost 2.0: New Tool for Training Better AI Models on More Complex Data -> https://aibusiness.com/ml/xgboost-2-0-new-tool-for-training-better-ai-models-on-more-complex-data
* Semantic link in Microsoft Fabric: Bridging BI and Data Science -> https://blog.fabric.microsoft.com/en-us/blog/semantic-link-use-fabric-notebooks-and-power-bi-datasets-for-machine-learning-data-validation-and-more
* Mastering Customer Segmentation with LLMs -> https://towardsdatascience.com/mastering-customer-segmentation-with-llm-3d9008235f41
### Tools
* ELT with Meltano (PostgreSQL -> Snowflake) -> https://medium.com/@danthelion/elt-with-meltano-postgressql-snowflake-a543c077ae1a
* Fast, Git Friendly API Client -> https://www.usebruno.com
------------------
Cette publication est sponsorisée par Affini-Tech et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, ExpĂ©rimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog dâAffini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous Ă [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
### LLM fever* Zephyr 7B -> https://www.linkedin.com/posts/lewis-tunstall_heres-a-simple-recipe-to-train-a-7b-model-activity-7117523535991857152-LuYg/?utm_source=share&utm_medium=member_desktop
* Bing Chat Enterprise -> Your AI-Powered Chat for Work | Bing Chat Enterprise (microsoft.com)
* promptflow -> promptflow/examples/tutorials/e2e-development/chat-with-pdf.md at main · microsoft/promptflow (github.com)
* n8n langchain -> https://n8n.io/workflows/1959-ailangchain-ai-chatbot-that-can-query-the-web/
### Data-eng* DuckDB Extensions for AWS Lambda -> https://extensions.quacking.cloud/
* Build Data Lake Pipelines with Google Pub/Sub -> https://medium.com/illumination/build-data-lake-pipelines-with-google-pub-sub-6ecb8da87c08
* Kestra has raised $3 million -> https://www.linkedin.com/posts/ludovic-dehon_opensource-activity-7115612770783350785-6nGr/
* Terraform @ scaleway -> https://datatask.io/blog/scaleway-terraform/
------------------
Cette publication est sponsorisée par Affini-Tech et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, ExpĂ©rimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog dâAffini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous Ă [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Linkedin Live avec Paul : Embeddings audio & image avec Serge Retkowsky -> https://www.linkedin.com/events/7101846404389580800/comments/
### LLM* First Impressions with GPT-4V(ision) -> https://blog.roboflow.com/gpt-4-vision/
* Expanding access to safer AI with Amazon -> https://www.anthropic.com/index/anthropic-amazon
* AutoGen: Enabling next-generation large language model applications -> https://www.microsoft.com/en-us/research/blog/autogen-enabling-next-generation-large-language-model-applications/
### Cloud* Motherduck (managed DBT) pricing -> https://motherduck.com/pricing/
* Real-time Analytics with Snowflake Dynamic Tables & Redpanda -> https://www.arecadata.com/real-time-analytics-with-dynamic-tables-in-snowflake-redpanda/
* Announcing BigQuery Omni cross-cloud joins -> https://cloud.google.com/blog/products/data-analytics/announcing-bigquery-omni-cross-cloud-joins
Cette publication est sponsorisée par Affini-Tech et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, ExpĂ©rimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog dâAffini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous Ă [email protected]
Le générique a été composé et réalisé par Maxence Lecointe - Show more