Preparação dos Dados:

  • Definição: O processo de limpar, transformar e preparar dados brutos para análise e machine learning.
  • Por que é importante: Dados sujos podem levar a previsões imprecisas do modelo. O preparo de dados garante que os dados sejam consistentes, completos e relevantes para sua tarefa.
  • Exemplos: Lidar com valores ausentes, remover duplicatas, converter tipos de dados, padronizar formatos.

Imputação de Dados:

  • Definição: O processo de preencher pontos de dados ausentes com valores estimados.
  • Por que é importante: Dados ausentes podem prejudicar o treinamento do modelo. A imputação ajuda a preservar dados valiosos substituindo valores ausentes por estimativas razoáveis.
  • Exemplos: Imputação pela média/mediana, imputação por k-vizinhos mais próximos, imputação baseada em modelo.

Aprendizado Supervisionado:

  • Definição: Um tipo de machine learning onde o modelo aprende com dados rotulados, onde cada ponto de dados possui uma saída ou variável alvo correspondente.
  • Por que é importante: O aprendizado supervisionado é usado para tarefas em que você deseja prever um resultado específico com base em recursos de entrada.
  • Exemplos: Regressão (prevendo valores contínuos), classificação (prevendo valores categóricos).

Aprendizado Não Supervisionado:

  • Definição: Um tipo de machine learning onde o modelo aprende com dados não rotulados, sem uma variável de saída específica.
  • Por que é importante: O aprendizado não supervisionado é usado para tarefas como encontrar padrões, agrupar dados e redução de dimensionalidade.
  • Exemplos: Agrupamento, aprendizado de regras de associação, detecção de anomalias.

Agrupamento:

  • Definição: Uma técnica de aprendizado não supervisionado que agrupa pontos de dados em clusters com base em sua similaridade.
  • Por que é importante: O agrupamento ajuda a descobrir padrões e estruturas ocultas nos dados, permitindo insights e segmentação.
  • Exemplos: Agrupamento K-means, agrupamento hierárquico, agrupamento baseado em densidade.

Classificação:

  • Definição: Uma técnica de aprendizado supervisionado que atribui pontos de dados a categorias ou classes predefinidas com base em seus recursos.
  • Por que é importante: A classificação ajuda a prever resultados categóricos, como se um e-mail é spam ou não, ou se um cliente vai cancelar a assinatura.
  • Exemplos: Regressão logística, árvores de decisão, máquinas de vetores de suporte (SVMs).

Métricas de Avaliação:

  • Definição: Medidas usadas para avaliar o desempenho de um modelo de machine learning.
  • Por que é importante: As métricas de avaliação ajudam a determinar a eficácia e precisão de um modelo, permitindo comparação e otimização.
  • Exemplos: Precision, recall, F1-score, AUC, RMSE.

Esses são apenas alguns dos muitos termos importantes em machine learning. À medida que você explora esse campo, encontrará mais termos e conceitos da área, mas entender esses fundamentos lhe dará uma base sólida para aprender e aplicar técnicas de machine learning.

Artigo Original: https://medium.com/@fertorresfs/termos-de-machine-learning-que-voc%C3%AA-deve-saber-dd67ef15db17

,


Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Pesquisar

Sobre a DSE

A DSE – Data Science Enthusiasts é mais do que uma comunidade online. Somos um ecossistema vibrante e engajado, dedicado a reunir estudantes, profissionais e entusiastas da área de Data Science em busca de aprendizado, networking e desenvolvimento de carreira. Fundada por Fernando Torres Ferreira da Silva em 26 de dezembro de 2024, a DSE nasceu da paixão por dados e da crença de que a colaboração é a chave para o sucesso no mundo da Ciência.

Galeria