Criando, treinando e avaliando um modelo de classificação de texto no BigQuery ML.
Olá, caro leitor ou cara leitora! Sou o Edvaldo, Cientista de Dados Jr. na Sauter e hoje vou te mostrar um recurso da Google Cloud que permite você criar, treinar e avaliar modelos de machine learning facilmente: o BigQuery ML.
Ta pronto(a)? Vem comigo!
O que vamos falar:
- Conhecendo BigQuery ML
- Classificação de Texto no BigQueryML: Prevendo qual a marca a partir da descrição do produto
…
Conhecendo BigQuery ML
Não dá pra falar de BigQuery ML sem antes falar de BigQuery.
Veja abaixo uma das melhores definições desse serviço:
O Bigquery é um banco de dados de armazenamento de dados analíticos de baixo custo totalmente gerenciado e em escala petabyte.
Essa definição é suficiente para você entender o poder desse serviço. Com o BigQuery você consegue armazenar e analisar dados prontos para análise com muita facilidade e baixo custo.


Vamos conhecê-lo um pouco melhor. Abaixo veja como é a UI do BigQuery:
- Projeto de Trabalho
- Projeto Linkado com os Datasets
- Datasets
- Local de Query
Legal! Mas, afinal, o que é BigQuery ML?
O BigQuery ML é um recurso que foi criado para lidar com análises de machine learning dentro do BigQuery.
Com ele você consegue criar, treinar e avaliar modelos de machine learning a partir de uma query usando linguagem SQL. Além disso, você também consegue fazer predições.
Quais modelos posso criar com esse recurso?
- Modelos Supervisionados: Regressão Linear; Regressão Logística.
- Modelos de Recomendação: Matriz Factorization;
- Modelos Não-Supervisionados: Clusterização.
Mas por que treinar meu modelo no BigQuery ML?
Treinar modelos no BigQuery ML oferece agilidade no teste de modelos sem antes transferir qualquer dado para outro local. Se você precisa de modelos rápidos e evitar esforço perdido, tente BigQuery ML. Assim você consegue enxergar se o modelo é aplicável aos seus dados ou não.
No próximo artigo iremos para a parte prática!
Continua no dia 20/08…