Cloudera CDP & Stream Processing para Real-Time Analytics com André Araújo, Field Engineer, Data in Motion na Cloudera

Episoder

Como é Trabalhar com Apache Spark na Visão de uma Engenharia de Dados Iniciante
29 May 2024· Engenharia de Dados [Cast]
No episódio de hoje Mateus Oliveira entrevistou Ananda Ellen (Engenharia de Dados), Leonardo Côco e Victor Grutner, integrantes do time de dados da One Way Solution.

Spark e Engenharia de Dados para Iniciantes, são tópicos extremamente relevantes nos dias de hoje, afinal, todos nós fomos iniciantes um dia.

Nesse bate-papo conversamos sobre quais desafios e conquistas temos durante o aprendizado de Apache Spark.

Não somente isso, falamos também sobre a área de Analytics na visão do Leonardo e do Victor, consultores da One Way Solution.
Neste podcast iremos falar sobre:
Área de AnalyticsApache Spark para Iniciantes
Esse podcast tem como principal intuito mostrar os desafios que os profissionais iniciantes na área de dados tem em comum, e como você pode se sobressair nestes desafios, com experiências de quem já passou por isso.
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
O Dia a Dia de um Analytics Engineer com o Time de Dados da Clicksign
27 Mar 2024· Engenharia de Dados [Cast]
No episódio de hoje Mateus Oliveira entrevistou Alessandro Gums (Analytics Engineer), Bruno Bento (Analytics Engineer) e Franklin Ferreira (Arquiteto de Dados), integrantes do time de dados da Clicksign.

Analytics Engineer se tornou uma grande thread do mercado e também uma necessidade nas empresas de hoje. fazer o split das responsabilidades de uma determinada área é comum e isso tinha que acontecer na engenharia de dados, devido a complexidade dos processos e necessidades de especialistas.
Neste bate papo iremos falar sobre:
Analytics EngineerModelagem de Dados nas empresas
Esse podcast tem como principal intuito mostrar o dia-a-dia dos Analytics Engineer nas empresas para que você, aspirante a esta área, entenda o exercicio da profissão na realidade.
Além disso, queremos demonstrar o quanto esta profissão vem crescendo e expandindo em grandes empresas como Clicksign.

Linkedin do time Clicksign
Franklin Ferreira (Arquiteto de dados): https://www.linkedin.com/in/franklinfs390/
Alessandro Gums (Analytics Engineer):https://www.linkedin.com/in/alessandro-gums/
Bruno Bento (Analytics Engineer):https://www.linkedin.com/in/bruno-pereira-bento/
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Mangler du episoder?

Klikk her for å oppdatere manuelt.
O Dia a Dia de um Arquiteto e Engenheiro de Dados com o Time de Dados da Clicksign
13 Mar 2024· Engenharia de Dados [Cast]
No episódio de hoje, Mateus Oliveira entrevistam Franklin Ferreira (Arquiteto de Dados) e Vinicius Gasparaini (Engenheiro de Dados), ambos integrantes do time de dados da Clicksign.

Arquitetura de Dados & Engenharia de Dados, são áreas que estão ganhando muita tração nos últimos anos, entender como elas funcionam dentro de uma empresas data-driven é, não só um dos melhores metódos de estudo de mercado, como também escolha de qual caminho seguir.
Neste bate papo iremos falar sobre:
Arquiteturas de DadosEngenharia de Dados
Esse podcast tem como principal intuito entender melhor como criar e evoluir arquiteturas de dados para melhor atender o negócio e como a engenharia de dados é usada dentro das grandes empresas, indo além de tecnologias e falando de metodologias e processos.

Linkedin do time Clicksign
Franklin Ferreira (Arquiteto de dados): https://www.linkedin.com/in/franklinfs390/
Vinicius Gasparini (Engenharia de Dados): https://www.linkedin.com/in/vngasp/ (editado)
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Data Analytics com o Time de Dados da Clicksign
5 Mar 2024· Engenharia de Dados [Cast]
No episódio de hoje, Leonardo Souza & Mateus Oliveira entrevistam Filipe Mubarac (Analista de dados), Acácio Komesu (Analista de BI), Levi de Carvalho (Analista de Dados) e Franklin Ferreira (Arquiteto de Dados), integrantes do time de dados e analytics da Clicksign.

Data Analytics sempre foi um das principais áreas dentro de uma empresa. Nos últimos anos, com certeza, passou de uma área de apoio a tomada de decisão a uma área core da empresa, pois o mundo hoje é data-driven, e tornou-se uma questão competitiva produzir e ler dados em grande escala, além de analisá-los para decisões usando Machine Learning, NLP e Generativa.

Neste bate-papo iremos falar sobre:
Data Analytics;Analytics e Business.

Este podcast tem como principal objetivo mostrar como as empresas constroem suas áreas de dados e analytics no dia a dia, como se tornar um profissional atrativo para empresas data-driven como a Clicksign, e como alinhar tudo com o business da empresa.

Linkedin do time Clicksign
Franklin Ferreira (Arquiteto de dados): https://www.linkedin.com/in/franklinfs390/
Filipe Mubarac (Analista de Dados): https://www.linkedin.com/in/filipemubarac/
Acácio Komesu (Analista de BI): https://www.linkedin.com/in/ac%C3%A1cio-komesu-14b244b5/
Levi de Carvalho (Analista de Dados) :https://www.linkedin.com/in/levidecarvalho/
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Desafios na Construção de uma Plataforma de Dados no Kubernetes com o Time do Orion
27 Feb 2024· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno & Mateus Oliveira entrevistam o time do Orion da One Way Solution.

Plataforma de Dados no Kubernetes é um dos tópicos mais pedidos para falarmos aqui no Podcast, principalmente para quem tem a necessidade de uma plataforma agnóstica a cloud e de baixo custo.

Neste bate papo iremos falar sobre:
Nas trincheiras da consultoria;Aprendendo Kubernetes;Plataforma de Dados no Kubernetes.
Esse podcast tem como principal objetivo mostrar os desafios de criar uma plataforma customizada usando open-source.

LinkedIn do time Orion
Site da One Way Solution
Strimzi
MinIO
Airflow

Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Gestão & Produtos de Dados com o Time de Dados da Clicksign
25 Jan 2024· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno & Mateus Oliveira entrevistaram
Thiago Rocha (Scrum Master), Marco Coimbra (Data Product Manager),
José Ivamotto (Head de Dados) e Franklin Ferreira (Arquiteto de Dados), integrantes do time de dados da Clicksign.

Gestão & Dados com Produto são tópicos extremamente relevantes nos dias de hoje.
Falar sobre dados sem se preocupar com a gestão, pode trazer impactos negativos às entregas envolvendo dados nas organizações.
Além disso, entender como as empresas vem produzindo dados é um excelente benchmarking para inovações.
Neste bate papo iremos falar sobre:
Dados como Produto;Times de dados;Gestão de Dados.
O principal objetivo deste episódio é mostrar como as empresas estão tratando esses tópicos no cotidiano.
Não apenas no nível técnico e gerencial, mas também com a visão de todos os envolvidos, Scrum Master e DPM (Data Product Manager).

Linkedin do time Clicksign
Thiago Rocha (Scrum Master): https://www.linkedin.com/in/thiago-rocha98/
Marco Coimbra (Data Product Manager): https://www.linkedin.com/in/marcoantoniocoimbrafilho/
Jose Ivamotto (Head de dados): https://www.linkedin.com/in/jose-ivamotto/
Franklin Ferreira (Arquiteto de dados): https://www.linkedin.com/in/franklinfs390/

Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Challenge in Bulding an Open-Source Community with Aaron Williams
21 Nov 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno e Mateus Oliveira entrevistaram Aron Willians, atualmente como Community Manager/ Developer Advocate na Ampare.

Aaron é apaixonado por trazer novas tecnologias para desenvolvedores atuais e para a próxima geração, por meio de hacking e treinamento prático. Neste podcast, você vai aprender sobre:
Desafios na construção da comunidade de código aberto; Visão gerencial de comunidades de dados;Empresas que estão investindo no impulsionamento do Pulsar.
Falamos também nesse bate-papo sobre os seguintes temas:
Tecnologia como Kuberbetes; Apache Pulsar.

Aprenda mais sobre as comunidades de dados e sobre as principais tecnologias do Mercado.
Ararob Willians= https://www.linkedin.com/in/aaron-don-williams/
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
O Desafio da Engenharia de Dados no iFood com o Diretor de ML e Engenharia, Ivan Lima
31 Oct 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno e Mateus Oliveira entrevistam Ivan Lima, atualmente Director of Machine Learning & Data Engineering no Ifood.

Ifood é uma das maiores empresas do Brasil e, claro, leva o assunto sobre dados muito a serio. Imagine receber diversos dados do aplicativo, além de possuir várias sessões analíticas e dados em alto volume.
Neste podcast, conversamos sobre:
Desafios na área de dados de grandes corporações;Visão gerencial.
Falamos também sobre os seguintes temas:
Mercado de trabalho no Brasil em 2022;Tecnologias usadas dentro do Ifood;Softskills;Gestão de times de dados.
Aprenda mais sobre como as empresas estão lidando com o desafio de dados internamente, principalmente de grande porte como Ifood.
Ivan Lima = Linkedin
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
The Data Lakehouse Paradigm with Bill Inmon - The Father of Data Warehouse
12 Oct 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno, Mateus Oliveira e Orlando Marley entrevistam Bill Inmon, criador do conceito de Data Warehouse e escritor de diversos livros com temáticas voltadas para dados.

Data Warehouse é o conceito de centralização de dados analíticos das organizações, de forma estruturar um visão 360° do business. Neste episódio, você irá aprender:
Diferenças entre OLTP e OLAP;Histórico dos dados para tomada de decisão;Criar um processo resiliente para entender os fatos dos dados.Falamos também,

neste bate-papo, sobre os seguintes temas: História do Bill Inmon;Pilares de sistemas analíticos;Nova geração de plataforma de dados analíticos;

Aprenda mais sobre análise de dados, como utilizar tecnologias para tornar o seu ambiente analítico confiável e resiliente com as palavras do pai do Data Warehouse.
Bill Inmon = Linkedin
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Querying Data with Trino from Earth to Space - Talk with Brian Olsen, a Developer Advocate at Starburst
9 Oct 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno e Mateus Oliveira entrevistam Brian Olsen, atualmente Head of Developer Relations na Tabular.

Trino é um produto open-source, para virtualizar os dados através de queries. Imagine uma engine de SQL capaz de consultar dados do Apache Kafka, Cloud Storage, Databases e diversas outras fontes de forma simples e extremamente eficaz.
Com Trino, você tem os seguintes benefícios:
Diversos conectores para múltiplas fontes de dadosGerar queries analytics de forma simples e eficazTrabalhar com modelos de Lakehouse como Iceberg e Delta
Falamos também neste bate-papo sobre os seguintes temas:
História do TrinoCapacidades do TrinoRecursos avançados Novas featuresAdaptive Query ExecutionCasos de Uso
Aprenda mais sobre Trino, e como utilizar esta tecnologia para explorar os dados em diversas fontes diferentes, junto com um dos principais vozes da comunidade.

Brian Olsen
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
A Day in a Life of a Founding Engineer at StarTree: Apache Pinot with Neha Pawar
25 Jul 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno e Mateus Oliveira entrevistam Neha Pawar, atualmente Founder Engineer na StarTree.

Apache Pinot é um banco de dados OLAP de baixa latência, que foi desenvolvido para queries analíticas dentro do Linkedin.
O objetivo é resolver um dos problemas que tecnologias como o Apache Kafka não resolvem, consultar bilhões de eventos com performance e baixa latêcia .

Com Apache Pinot, você tem os seguintes benefícios:
Alto desempenho de consultas analíticas; Dados que residem no Apache Pinot são comprimidos; Habilita milhares de acessos concorrentes aos dados residentes no Apache Pinot.
Falamos também sobre os temas:
Criação do Apache Pinot; User Facing Analytics;Tipos de Deployment no Apache Pinot; O que vem por aí no Apache Pinot.
Aprenda mais sobre Apache Pinot, uma tecnologia capaz de armazenar dados em tempo real, e executar queries com baixa latência, chegando até milissegundos.
Neha Pawar = Linkedin
https://pinot.apache.org/

Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Simplificando Projetos de Analytics utilizando dbt e Modern Data Stack com Matheus Willian, Head of Data Engineering na One Way Solution
4 Jul 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno e Mateus Oliveira conversam com Matheus Willian, atualmente Head de Engenharia de Dados na One Way Solution.

dbt é uma das tecnologias mais faladas e utilizadas fora do país, possibilitando aos times de todos os portes trabalhar com o conceito de Modern Data Stack, tornando o desenvolvimento de transformações dos dados de forma simples e com SQL.

Com dbt, você tem os seguintes benefícios:
Desenvolvimento de pipeline de dados usando SQL;Reutilização dos códigos usando estruturas de git;Simplificação da Stack de dados;Processamento em Modern Data Warehouses dentro outros adapters.
Falamos também nesse bate-papo sobre os seguintes temas:
Dados como pilar central;Dbt;Times de BI Moderno.
Aprenda mais sobre dbt, como utilizar uma tecnologia para Modern Data Stack, junto com o time da One Way Solution, que mais impulsiona a comunidade, tanto com conteúdo, como com treinamentos e eventos para ajudar os profissionais de dados brasileiros em vagas de trabalho dentro e fora do país.

Matheus Willian = https://www.linkedin.com/in/matheuswillian/
https://www.getdbt.com/
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Conferência Kafka Summit 2023 London
27 Jun 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno e Mateus Oliveira conversam sobre a participação no Kafka Summit London 2023.
Kafka Summit é uma das maiores conferências de tecnologia do mundo, onde empresas de tecnologias de streaming anunciam novidades e podemos entender mais sobre como as elas estão usando estas tecnologias no dia a dia.

Na conferência tivemos 3 momentos:
Keynote - (Anúncios);Vendor Hall - (Onde os patrocinadores ficam); Sessions - (Salas que os palestrantes fazem suas apresentações).

Falamos também nesse bate-papo sobre os seguintes temas:

Anúncios Open-Source;Anúncios Confluent;Overview das sessões;Hall dos patrocinadores;Impressões principais da Conferência.

Aprenda mais sobre tecnologias como Apache Kafka, Apache Flink dentre outras de Streaming. Além disso, vamos entender como as empresas como financeiras europeias, Apple, Uber, Netflix, entre outras, estão usando o Apache Kafka para resolver problemas de negócio.

Kafka Summit 2023 London
https://www.confluent.io/events/kafka-summit-london-2023/

Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Cloudera CDP & Stream Processing para Real-Time Analytics com André Araújo, Field Engineer, Data in Motion na Cloudera
22 Jun 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno & Mateus Oliveira entrevistaram André Araújo , atualmente como Field Engineer, Data in Motion na Cloudera.
CDP é uma Plataforma de Dados Enterprise Cloudera, com foco na versatilidade em casos de uso como Streaming Platform, possuindo tecnologias como Apache Kafka e Apache Flink .
Com CSP, você tem os seguintes benefícios:
Apache Kafka - Plataforma de armazenamento de Streaming de Dados líder de mercado;Apache Flink - Plataforma de Processamento de Dados.
Neste bate-papo vamos falar sobre:
Plataforma de Dados Cloudera ;Plataforma de transmissão Cloudera .
O Cloudera sempre foi uma das plataformas mais utilizadas no mercado, agora com a nova versão e casos de uso que atendem diversos cenários, como o caso do CSP ( Cloudera Stream Platform ).
André Araújo = Linkedin
Cloudera = webpage

Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Connecting Data Engineering and ML to Build an Efficient End-to-End Data Product Flow with Aurimas Griciūnas
15 Jun 2023· Engenharia de Dados [Cast]
No episódio de hoje, Mateus Oliveira e Matheus Willian entrevistaram Aurimas Griciūnas, atualmente Fundador e CEO da Swirl AI & Arquiteto Sênior de Soluções da neptune ai.
Engenharia de Dados e Ciência de Dados são, hoje, as áreas de maior demanda no mercado internacional e nacional.
O primeiro, cria soluções para disponibilização de dados da melhor forma e o segundo, cria algoritmos de predição para aprimorar e automatizar decisões.
Para melhor entender a relação entre as áreas, vamos falar sobre:
O que é Engenharia de Dados e quais as suas vertentes?O que é Ciência de Dados e quais as suas vertentes?
Falamos também, neste bate-papo, sobre os seguintes temas:
Profissões de dados;Dados como produto;Universo de Ciência de Dados;
Aprenda como funciona essa relação entre os times e como o mercado está se movendo para segmentações de alguns cargos emergentes de outros cargos.

Swirl AI = https://www.swirlai.com/
Aurimas Griciūnas = Linkedin

Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Dremio & Iceberg for Building an Open-Source Data Lakehouse with Dipankar Mazumdar, Data Advocate at Dremio
6 Jun 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno, Mateus Oliveira e Antony Lucas entrevistaram Dipankar Mazumdar, atualmente como Data Advocate na Dremio.

Dremio é uma das mais conhecidas tecnologias de Self-Service SQL Analytics de mercado, unificando a visão dos dados e utilizando a lingua franca de dados: o SQL.

Alinhado com o Apache Iceberg, o Dremio traz a proposta de ser um Open Data Lakehouse.
Com Apache Iceberg, você tem os seguintes benefícios:
Compactação de Dados;Time Travel;ACID;Hidden Partition;Desenvolvido para multi-plataforma.

Falamos também nesse bate-papo sobre os seguintes temas:
Engenharia de Dados;Apache Iceberg;Dremio.

Aprenda mais sobre como o Dremio e Iceberg que juntos, podem prover mais uma opção de Data Lakehouse, principalmente para casos que vamos trabalhar com plataformas distintas de processamento e exploração de dados.
Dipankar Mazumdar = Linkedin
https://www.dremio.com/
https://iceberg.apache.org/

Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Simplify Data Engineering Projects in Your Lakehouse with Delta Lake Framework with Matthew Powers & Denny Lee, Developer Advocates at Databricks
23 May 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno e Mateus Oliveira entrevistaram Denny Lee & Mathew Powers, atualmente Developer Advocates na Databricks.

Delta Lake é um produto open-source, que nos permite aplicar o famoso Data Lakehouse {Data Lake + Data Warehouse}, desenvolvido pela empresa dos criadores do Apache Spark. Delta Lake resolve o problema do Apache Spark, armazenamento, processamento de dados no Data Lake de forma otimizada.

Com Delta Lake, você tem os seguintes benefícios:
Formato de arquivo como se fosse uma tabela;Time Travel;ACID;Batch e Streaming Unificados.

Falamos também nesse bate-papo sobre os seguintes temas:
Estado da arte dos dados;Delta Lake.

Aprenda mais sobre Delta Lake, como utilizar uma tecnologia para Data LakeHouse, junto com o time da databricks que mais impulsiona a comunidade com conteúdos, releases e eventos para ajudar este produto open-source.
Denny Lee - Linkedin
Mathew Powers - Linkedin
https://delta.io/

Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Spark on Kubernetes [SPOK] with Hudson Buzby, Solutions Architect at Spot.io
11 May 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno, Mateus Oliveira & Tiago Xavier entrevistaram Hudson Buzby, atualmente como Arquiteto de Soluções na Spot by NetApp.

SPOK ou Spark Operator on Kubernetes, é o deployment para Apache Spark que utiliza um Operator de Kubernetes para melhor gerenciar os drivers e executors usando Kubernetes como infraestrutra escalável.

Com SPOK, você possui os seguintes benefícios:
Melhor utilização de recursos escaláveis.Infraestrutura mais leve.Criação de serviços Serverless {Ocean}

Falamos também nesse bate-papo sobre os seguintes temas:
HistóriaSpark Operator on KubernetesOcean for Apache SparkDicas das trincheiras
Nesta sessão você aprenderá a utilizar melhor o Apache Spark no Kubernetes, e entender um pouco mais porque os clientes da Spot embarcaram nesta jornada.

Spot
Hudson Buzby
Data Mechanics
Ocean for Apache Spark

Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
SQLMesh | Streamlining Python & SQL Transformations with Tobias Mao, Co-Founder & CTO at Tobiko Data
4 May 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno & Mateus Oliveira entrevistaram Tobias Mao, atualmente como Co-Founder e CTO na Tobiko Data.

SQLMesh é um framework desenvolvido em Python para automatizar tudo que se faça necessário para uma plataforma de dados escalável utilizando o conceito de DataOps.

Com SQLMesh, você possui os seguintes benefícios:
Foco nos dados do negócio, usando DataOps como premissa principal. Foco em escalabilidade sem se preocupar com seu Data Warehouse ou Engine de Query.

Nosso bate papo iremos falar sobre:
Estado dos Dados {State of Data}SQLMeshDataOpsPython e SQL para Engenharia de DadosTobiko Data

Em todas as organizações independentemente do porte, vemos a necessidade de tornar o processo de uso dos dados mais escalável, sendo assim o SQLMesh é uma excelente opção para otimizar o processo de DataOps.
Tobias MaoSQLMeshTobiko Data
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
O Poder do Lineage de Dados com Lucas Galindo & Gabs Ferreira da Alvin
19 Apr 2023· Engenharia de Dados [Cast]
No episódio de hoje, Luan Moreno e Mateus Oliveira entrevistaram Lucas Galindo Data Engineer/Software Engineer & Gabs Ferreira Community Builder, ambos trabalhando na Alvin.

A solução Alvin cria e mantém automaticamente um conjunto de dados de gráfico conectando em fontes de dados, como Snowflake, Redshift, dentre outros entregando uma solução da Data Lineage robusta.

O Alvin oferece os seguintes benefícios:
Uma maneira automatizada de detectar e rastrear erros/bugs
do pipeline, reduzindo o tempo de inatividade dos dados.Automatiza o teste de regressão, fornecendo um relatório detalhado do impacto downstream antes da implantação do código.Mapeia automaticamente os fluxos de dados dentro e entre os sistemas e mostra como eles são consumidos em toda a empresa.

Neste podcast, foi também argumentado assuntos como governança, democratização e qualidade dos dados.
Conceitos de Linhagem de Dados e Governança de DadosFeatures Integrações disponíveis na Plataforma da Alvin.Diferenças de mercado (Nacional & Internacional).Comunidade de Dados.

Entenda porque precisamos de governança de dados e como a Alvin pode nos entregar um produto focado em Linhagem de Dados para agregar valor para aos seus cliente.

Alvin
Gabs Ferreira
Lucas Galindo
Luan Moreno =
https://www.linkedin.com/in/luanmoreno/
- Lytte Lytte igjen Fortsette Lytter...
- Lytte senere Lytte senere
Se mer

Episoder

Como é Trabalhar com Apache Spark na Visão de uma Engenharia de Dados Iniciante

O Dia a Dia de um Analytics Engineer com o Time de Dados da Clicksign

O Dia a Dia de um Arquiteto e Engenheiro de Dados com o Time de Dados da Clicksign

Data Analytics com o Time de Dados da Clicksign

Desafios na Construção de uma Plataforma de Dados no Kubernetes com o Time do Orion

Gestão & Produtos de Dados com o Time de Dados da Clicksign

Challenge in Bulding an Open-Source Community with Aaron Williams

O Desafio da Engenharia de Dados no iFood com o Diretor de ML e Engenharia, Ivan Lima

The Data Lakehouse Paradigm with Bill Inmon - The Father of Data Warehouse

Querying Data with Trino from Earth to Space - Talk with Brian Olsen, a Developer Advocate at Starburst

A Day in a Life of a Founding Engineer at StarTree: Apache Pinot with Neha Pawar

Simplificando Projetos de Analytics utilizando dbt e Modern Data Stack com Matheus Willian, Head of Data Engineering na One Way Solution

Conferência Kafka Summit 2023 London

Connecting Data Engineering and ML to Build an Efficient End-to-End Data Product Flow with Aurimas Griciūnas

Dremio & Iceberg for Building an Open-Source Data Lakehouse with Dipankar Mazumdar, Data Advocate at Dremio

Simplify Data Engineering Projects in Your Lakehouse with Delta Lake Framework with Matthew Powers & Denny Lee, Developer Advocates at Databricks

Spark on Kubernetes [SPOK] with Hudson Buzby, Solutions Architect at Spot.io

SQLMesh | Streamlining Python & SQL Transformations with Tobias Mao, Co-Founder & CTO at Tobiko Data

O Poder do Lineage de Dados com Lucas Galindo & Gabs Ferreira da Alvin