Preparação dos Dados:
- Definição: O processo de limpar, transformar e preparar dados brutos para análise e machine learning.
- Por que é importante: Dados sujos podem levar a previsões imprecisas do modelo. O preparo de dados garante que os dados sejam consistentes, completos e relevantes para sua tarefa.
- Exemplos: Lidar com valores ausentes, remover duplicatas, converter tipos de dados, padronizar formatos.
Imputação de Dados:
- Definição: O processo de preencher pontos de dados ausentes com valores estimados.
- Por que é importante: Dados ausentes podem prejudicar o treinamento do modelo. A imputação ajuda a preservar dados valiosos substituindo valores ausentes por estimativas razoáveis.
- Exemplos: Imputação pela média/mediana, imputação por k-vizinhos mais próximos, imputação baseada em modelo.
Aprendizado Supervisionado:
- Definição: Um tipo de machine learning onde o modelo aprende com dados rotulados, onde cada ponto de dados possui uma saída ou variável alvo correspondente.
- Por que é importante: O aprendizado supervisionado é usado para tarefas em que você deseja prever um resultado específico com base em recursos de entrada.
- Exemplos: Regressão (prevendo valores contínuos), classificação (prevendo valores categóricos).
Aprendizado Não Supervisionado:
- Definição: Um tipo de machine learning onde o modelo aprende com dados não rotulados, sem uma variável de saída específica.
- Por que é importante: O aprendizado não supervisionado é usado para tarefas como encontrar padrões, agrupar dados e redução de dimensionalidade.
- Exemplos: Agrupamento, aprendizado de regras de associação, detecção de anomalias.
Agrupamento:
- Definição: Uma técnica de aprendizado não supervisionado que agrupa pontos de dados em clusters com base em sua similaridade.
- Por que é importante: O agrupamento ajuda a descobrir padrões e estruturas ocultas nos dados, permitindo insights e segmentação.
- Exemplos: Agrupamento K-means, agrupamento hierárquico, agrupamento baseado em densidade.
Classificação:
- Definição: Uma técnica de aprendizado supervisionado que atribui pontos de dados a categorias ou classes predefinidas com base em seus recursos.
- Por que é importante: A classificação ajuda a prever resultados categóricos, como se um e-mail é spam ou não, ou se um cliente vai cancelar a assinatura.
- Exemplos: Regressão logística, árvores de decisão, máquinas de vetores de suporte (SVMs).
Métricas de Avaliação:
- Definição: Medidas usadas para avaliar o desempenho de um modelo de machine learning.
- Por que é importante: As métricas de avaliação ajudam a determinar a eficácia e precisão de um modelo, permitindo comparação e otimização.
- Exemplos: Precision, recall, F1-score, AUC, RMSE.
Esses são apenas alguns dos muitos termos importantes em machine learning. À medida que você explora esse campo, encontrará mais termos e conceitos da área, mas entender esses fundamentos lhe dará uma base sólida para aprender e aplicar técnicas de machine learning.
Artigo Original: https://medium.com/@fertorresfs/termos-de-machine-learning-que-voc%C3%AA-deve-saber-dd67ef15db17