Episodes
-
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-194-self-service-data-avec-tristan-mayer/
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-193-microsoft-fabric-avec-marie-aubert
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Missing episodes?
-
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-192-duckdb-et-autres-avec-christophe-blefari
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-191-popsink-avec-benjamin-djidi
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Retrouvez les liens de cet Ă©pisode dans les shownotes sur
https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/
------------------
Cette publication est sponsorisée par Datatask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Consulter le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda
* IA ACT
* Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/
* From Silos to Standardization: Leveraging DBT for a Democratized Data Framework -> https://medium.com/uc-engineering/from-silos-to-standardization-leveraging-dbt-for-a-democratized-data-framework-f444dcd07cd9
* DuckDB vs Polars -> https://medium.com/gitconnected/duckdb-vs-polars-2ff19cc7af41
* Meetup Python sur les frameworks UI -> https://youtu.be/yspHNEFjKfQ?list=PLv7xGPH0RMUT1GSCGHJmqnswpk-nyz5aq
* NiceGUI -> https://nicegui.io
------------------
Cette publication est sponsorisée par Affini-Tech et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, ExpĂ©rimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog dâAffini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous Ă [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
Shownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/
-
### Promptologues
* How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb
* Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua
### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/
* embedchain/embedchain: The Open Source RAG framework -> https://github.com/embedchain/embedchain
* A Guide to Large Language Model Abstractions - Two Sigma -> https://www.twosigma.com/articles/a-guide-to-large-language-model-abstractions/
### Data eng* How to Scale Your Data Pipelines and Data Products with Contract Testing and Dbt -> https://towardsdatascience.com/how-to-scale-your-data-pipelines-and-data-products-with-dbt-and-contract-testing-10c92ea9a443
* dbt Alternatives -> https://www.greenmountaindatasolutions.com/blog/alternatives-to-dbt-data-build-tool -
Shownotes sur :
https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/ -
Shownotes sur :
https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/ -
https://bigdatahebdo.com/podcast/episode-180-quelques-news-pour-demarrer-2024/
-
### LLM fever* [GAIC-fr] Analyse des annonces IA de MS Ignite -> https://www.youtube.com/watch?v=rJTcJHh6bcY
* LightOn annonce la seconde version dâAlfred, son modĂšle LLM open-source -> https://www.actuia.com/actualite/lighton-annonce-la-seconde-version-dalfred-son-modele-llm-open-source/
* Introducing Claude 2.1 -> https://www.anthropic.com/index/claude-2-1
* Welcome to the Hallucination Index! -> https://www.rungalileo.io/hallucinationindex
### data-engineering
* Multithreading Framework for Data Ingestion -> https://awstip.com/multithreading-framework-for-data-ingestion-3c3c8480b8d0
* Talend Open Studio c'est fini au 31/1/202 -> https://community.talend.com/s/question/0D55b00009OuDGPCA3/update-on-the-future-of-talend-open-studio?language=en_US
* MotherDuck: Making PySpark Code Faster with DuckDB -> https://motherduck.com/blog/making-pyspark-code-faster-with-duckdb
* How to Extract Data Observability Metrics from Snowflake Using SQL -> https://towardsdatascience.com/how-to-extract-data-observability-metrics-from-snowflake-using-sql-9bf001038788 -
### LLM fever
* Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123
* ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résult
ats -> https://generationia.flint.media/p/step-back-prompting-reculer-pour-mieux-sauter
* Microsoft optimise Azure avec ses propres puces dâIA -> https://www.actuia.com/actualite/microsoft-optimise-azure-avec-ses-propres-puces-dia/
### Data-eng
* data load tool (dlt) -> https://dlthub.com/
* Microsoft and Google join forces on OneTable, an open-source solution for data lake challenges -> https://venturebeat.com/data-infrastructure/exclusive-microsoft-and-google-join-forces-on-onetable-an-open-source-solution-for-data-lake-challenges/
------------------
Cette publication est sponsorisée par Affini-Tech et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, ExpĂ©rimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog dâAffini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous Ă [email protected]
Le générique a été composé et réalisé par Maxence Lecointe -
* Why can't datacenter operators stop thinking about atomic power? -> https://www.theregister.com/2023/09/27/datacenters_nuclear_power
### LLM fever* Evaluate LLMs and RAG a practical example using Langchain and Hugging Face -> https://www.philschmid.de/evaluate-llm
* Introducing the Giskard Bot: Enhancing LLM Testing & Debugging on Hugging Face -> https://huggingface.co/blog/JMJM/giskard-llm-testing-and-debugging-hf
* Introducing Canopy: An easy, free, and flexible RAG framework powered by Pinecone -> https://www.pinecone.io/blog/canopy-rag-framework/
### Tools* Pijul -> https://pijul.org/
* Pijul la théorie -> https://pijul.org/manual/theory.html
### meetup* "Ou va la modern Data Stack ?" le 31 janvier 2024 chez Criteo -> https://www.linkedin.com/company/modern-data-stack-france/
------------------
Cette publication est sponsorisée par Affini-Tech et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France.
Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, ExpĂ©rimenter et Executer vos services ! (Affini-Tech, Datatask) Consulter le blog dâAffini-Tech et le blog de Datatask pour en savoir plus. On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous Ă [email protected]
Le générique a été composé et réalisé par Maxence Lecointe - Show more