好色先生TV

Tópicos técnicos

O que é aprendizado de máquina?

Ilustra??o de itens de TI com foco em um ponto de interroga??o

Vis?o geral

O aprendizado de máquina é um subconjunto da inteligência artificial focado na cria??o de sistemas que podem aprender com dados históricos, identificar padr?es e tomar decis?es lógicas com pouca ou nenhuma interven??o humana. ? um método de análise de dados que automatiza a cria??o de modelos analíticos por meio do uso de dados que abrangem diversas formas de informa??es digitais, incluindo números, palavras, cliques e imagens.

Os aplicativos de aprendizado de máquina aprendem com os dados de entrada e melhoram continuamente a precis?o dos resultados usando métodos de otimiza??o automatizados. A qualidade de um modelo de aprendizado de máquina depende de dois aspectos principais:

  1. A qualidade dos dados de entrada. Uma frase comum no desenvolvimento de algoritmos de aprendizado de máquina é "garbage in, garbage out". Esse ditado significa que, se você inserir dados de baixa qualidade ou bagun?ados, o resultado do seu modelo será amplamente impreciso.
  2. A escolha do modelo em si. No aprendizado de máquina, há uma infinidade de algoritmos que um cientista de dados pode escolher, todos com seus próprios usos específicos. ? fundamental escolher o algoritmo correto para cada caso de uso. As redes neurais s?o um tipo de algoritmo com grande destaque devido à alta precis?o e versatilidade que podem oferecer. No entanto, para pequenas quantidades de dados, a escolha de um modelo mais simples geralmente apresenta melhor desempenho.

Quanto melhor for o modelo de aprendizado de máquina, mais precisamente ele poderá encontrar recursos e padr?es nos dados. Isso, por sua vez, implica que suas decis?es e previs?es ser?o mais precisas.

好色先生TV ArcSight Intelligence para CrowdStrike

Prote??o sem precedentes que combina aprendizado de máquina e seguran?a de endpoint com ca?a a amea?as de classe mundial como um servi?o.

Aprendizado de máquina

Por que o aprendizado de máquina é importante?

Por que usar o aprendizado de máquina? A import?ncia do aprendizado de máquina está crescendo devido aos volumes e à variedade cada vez maiores de dados, ao acesso e à acessibilidade do poder computacional e à disponibilidade de Internet de alta velocidade. Esses fatores de transforma??o digital possibilitam o desenvolvimento rápido e automático de modelos que podem analisar com rapidez e precis?o conjuntos de dados extraordinariamente grandes e complexos.

Há uma infinidade de casos de uso aos quais o aprendizado de máquina pode ser aplicado para reduzir custos, mitigar riscos e melhorar a qualidade de vida em geral, incluindo a recomenda??o de produtos/servi?os, a detec??o de viola??es de seguran?a cibernética e a habilita??o de carros aut?nomos. Com maior acesso a dados e poder de computa??o, o aprendizado de máquina está se tornando mais onipresente a cada dia e, em breve, será integrado a muitas facetas da vida humana.


Como funciona o aprendizado de máquina?

Há quatro etapas principais que você deve seguir ao criar um modelo de aprendizado de máquina.

  1. Escolha e prepare um conjunto de dados de treinamento

    Os dados de treinamento s?o informa??es representativas dos dados que o aplicativo de aprendizado de máquina ingerirá para ajustar os par?metros do modelo. ?s vezes, os dados de treinamento s?o rotulados, o que significa que foram marcados para indicar classifica??es ou valores esperados que o modo de aprendizado de máquina deve prever. Outros dados de treinamento podem n?o ser rotulados, de modo que o modelo terá de extrair recursos e atribuir clusters de forma aut?noma.

    Para serem rotulados, os dados devem ser divididos em um subconjunto de treinamento e um subconjunto de teste. O primeiro é usado para treinar o modelo e o segundo para avaliar a eficácia do modelo e encontrar maneiras de melhorá-lo.

  2. Selecione um algoritmo para aplicar ao conjunto de dados de treinamento

    O tipo de algoritmo de aprendizado de máquina que você escolher dependerá principalmente de alguns aspectos:

    • Se o caso de uso é a previs?o de um valor ou a classifica??o que usa dados de treinamento rotulados ou se o caso de uso é o agrupamento ou a redu??o de dimensionalidade que usa dados de treinamento n?o rotulados
    • Qual é a quantidade de dados no conjunto de treinamento
    • A natureza do problema que o modelo busca resolver

    Para casos de uso de previs?o ou classifica??o, você normalmente usaria algoritmos de regress?o, como regress?o de mínimos quadrados comuns ou regress?o logística. Com dados n?o rotulados, é provável que você confie em algoritmos de agrupamento, como k-means ou vizinho mais próximo. Alguns algoritmos, como redes neurais, podem ser configurados para trabalhar com casos de uso de clustering e previs?o.

  3. Treinar o algoritmo para criar o modelo

    O treinamento do algoritmo é o processo de ajuste das variáveis e dos par?metros do modelo para prever com mais precis?o os resultados apropriados. O treinamento do algoritmo de aprendizado de máquina geralmente é iterativo e usa uma variedade de métodos de otimiza??o, dependendo do modelo escolhido. Esses métodos de otimiza??o n?o requerem interven??o humana, o que faz parte do poder do aprendizado de máquina. A máquina aprende com os dados que você fornece a ela, com pouca ou nenhuma orienta??o específica do usuário.

  4. Use e aprimore o modelo

    A última etapa é alimentar o modelo com novos dados como forma de melhorar sua eficácia e precis?o ao longo do tempo. A origem das novas informa??es depende da natureza do problema a ser resolvido. Por exemplo, um modelo de aprendizado de máquina para carros aut?nomos receberá informa??es do mundo real sobre as condi??es da estrada, objetos e leis de tr?nsito.


Métodos de aprendizado de máquina

O que é aprendizado de máquina supervisionado

Os algoritmos de aprendizado de máquina supervisionados usam dados rotulados como dados de treinamento, em que as saídas apropriadas para os dados de entrada s?o conhecidas. O algoritmo de aprendizado de máquina recebe um conjunto de entradas e as saídas corretas correspondentes. O algoritmo compara suas próprias saídas previstas com as saídas corretas para calcular a precis?o do modelo e, em seguida, otimiza os par?metros do modelo para melhorar a precis?o.

O aprendizado de máquina supervisionado se baseia em padr?es para prever valores em dados n?o rotulados. Ele é usado com mais frequência na automa??o, em grandes quantidades de registros de dados ou em casos em que há muitas entradas de dados que n?o podem ser processadas com eficiência por humanos. Por exemplo, o algoritmo pode detectar transa??es de cart?o de crédito que provavelmente s?o fraudulentas ou identificar o cliente de seguro que provavelmente registrará um sinistro.

O que é aprendizado de máquina n?o supervisionado

O aprendizado de máquina n?o supervisionado é melhor aplicado a dados que n?o têm respostas estruturadas ou objetivas. N?o há pré-determina??o do resultado correto para uma determinada entrada. Em vez disso, o algoritmo deve entender a entrada e tomar a decis?o apropriada. O objetivo é examinar as informa??es e identificar a estrutura dentro delas.

O aprendizado de máquina n?o supervisionado funciona bem com informa??es transacionais. Por exemplo, o algoritmo pode identificar segmentos de clientes que possuem atributos semelhantes. Os clientes desses segmentos podem, ent?o, ser alvo de campanhas de marketing semelhantes. As técnicas populares usadas no aprendizado n?o supervisionado incluem mapeamento do vizinho mais próximo, mapas auto-organizáveis, decomposi??o de valor singular e agrupamento k-means. Os algoritmos s?o usados posteriormente para segmentar tópicos, identificar outliers e recomendar itens.


Qual é a diferen?a entre aprendizado de máquina supervisionado e n?o supervisionado?

Aspecto

Aprendizagem supervisionada

Aprendizado n?o supervisionado

Processo

As variáveis de entrada e saída s?o fornecidas para treinar o modelo.

Somente os dados de entrada s?o fornecidos para treinar o modelo. Nenhum dado de saída é usado.

Dados de entrada

Usa dados rotulados.

Usa dados n?o rotulados.

Algoritmos suportados

Oferece suporte a algoritmos de regress?o, algoritmos baseados em inst?ncias, algoritmos de classifica??o, redes neurais e árvores de decis?o.

Oferece suporte a algoritmos de agrupamento, algoritmos de associa??o e redes neurais.

Complexidade

Mais simples.

Mais complexo.

Subjetividade

Objetivo.

Subjetivo.

Número de classes

O número de classes é conhecido.

O número de aulas é desconhecido.

Principal desvantagem

? difícil classificar dados massivos com aprendizado supervisionado.

A escolha do número de clusters pode ser subjetiva.

Objetivo principal

Treine o modelo para prever a saída quando receber novas entradas.

Encontre percep??es úteis e padr?es ocultos.


O que o aprendizado de máquina pode fazer: Aprendizado de máquina no mundo real

Embora a funcionalidade de aprendizado de máquina já exista há décadas, foi a capacidade mais recente de aplicar e computar automaticamente cálculos matemáticos complexos envolvendo big data que lhe conferiu uma sofistica??o sem precedentes. Atualmente, o campo de aplica??o do aprendizado de máquina é vasto e vai desde a AIOps empresarial até o varejo on-line. Alguns exemplos do mundo real dos recursos de aprendizado de máquina atualmente incluem o seguinte:

  • Seguran?a cibernética usando análise comportamental para determinar eventos suspeitos ou an?malos que possam indicar amea?as internas, ou ataques de dia zero.
  • Projetos de carros aut?nomos, como o (uma subsidiária da Alphabet Inc.) e o da Tesla, que está um passo abaixo dos carros aut?nomos reais.
  • Assistentes digitais como Siri, Alexa e Google Assistant que pesquisam informa??es na Web em resposta aos nossos comandos de voz.
  • Recomenda??es personalizadas ao usuário que s?o orientadas por algoritmos de aprendizado de máquina em sites e aplicativos como Netflix, Amazon e YouTube.
  • Solu??es de detec??o de fraudes e resiliência cibernética que agregam dados de vários sistemas, revelam clientes que apresentam comportamento de alto risco e identificam padr?es de atividades suspeitas. Essas solu??es podem usar o aprendizado de máquina supervisionado e n?o supervisionado para classificar as transa??es das organiza??es financeiras como fraudulentas ou legítimas. ? por isso que um consumidor pode receber mensagens de texto de sua empresa de cart?o de crédito verificando se uma compra incomum usando as credenciais financeiras do consumidor é legítima. O aprendizado de máquina avan?ou tanto na área de fraudes que muitas empresas de cart?o de crédito anunciam que os consumidores n?o ser?o culpados se as transa??es fraudulentas n?o forem detectadas pelos algoritmos da organiza??o financeira.
  • O reconhecimento de imagens teve avan?os significativos e pode ser usado de forma confiável para reconhecimento facial, leitura de caligrafia em cheques depositados, monitoramento de tráfego e contagem do número de pessoas em uma sala.
  • Filtros de spam que detectam e bloqueiam e-mails indesejados nas caixas de entrada.
  • Servi?os públicos que analisam dados de sensores para encontrar maneiras de melhorar a eficiência e reduzir custos.
  • Dispositivos médicos vestíveis que capturam em tempo real dados valiosos para uso na avalia??o contínua da saúde do paciente.
  • Aplicativos de táxi que avaliam as condi??es de tráfego em tempo real e recomendam a rota mais eficiente.
  • A análise de sentimento determina o tom de uma linha de texto. Boas aplica??es da análise de sentimento s?o o Twitter, as avalia??es de clientes e os respondentes de pesquisas:
    • Twitter: uma maneira de avaliar as marcas é detectar o tom dos tweets direcionados a uma pessoa ou empresa. Empresas como a Crimson Hexagon e a Nuvi fornecem isso em tempo real.
    • Avalia??es de clientes: Você pode detectar o tom das avalia??es dos clientes para avaliar o desempenho de sua empresa. Isso é especialmente útil se n?o houver um sistema de classifica??o associado a avalia??es de clientes em texto livre.
    • Pesquisas: O uso da análise de sentimentos nas respostas de texto livre de uma pesquisa pode lhe dar uma avalia??o rápida de como os entrevistados se sentem. A Qualtrics tem isso implementado em suas pesquisas.
  • A análise de segmenta??o de mercado usa o aprendizado de máquina n?o supervisionado para agrupar os clientes de acordo com os hábitos de compra para determinar diferentes tipos ou personas de clientes. Isso permite que você conhe?a melhor seus clientes mais valiosos ou mal atendidos.
  • ? fácil pressionar ctrl+F para pesquisar palavras e frases exatas em um documento, mas se você n?o souber a frase exata que está procurando, pode ser difícil pesquisar documentos. O aprendizado de máquina pode usar técnicas como métodos difusos e modelagem de tópicos para tornar esse processo muito mais fácil, permitindo que você pesquise documentos sem saber a frase exata que está procurando.

O papel do aprendizado de máquina continuará a crescer

? medida que os volumes de dados crescem, a capacidade de computa??o aumenta, a largura de banda da Internet se expande e os cientistas de dados aprimoram seus conhecimentos, o aprendizado de máquina continuará a impulsionar uma eficiência maior e mais profunda no trabalho e em casa.

Com as amea?as cibernéticas cada vez maiores que as empresas enfrentam atualmente, o aprendizado de máquina é necessário para proteger dados valiosos e manter os hackers fora das redes internas. Nosso principal software UEBA SecOps, ArcSight Intelligence , usa o aprendizado de máquina para detectar anomalias que podem indicar a??es mal-intencionadas. Ele tem um histórico comprovado de detec??o de amea?as internas, ataques de dia zero e até mesmo ataques agressivos de equipes vermelhas.

Notas de rodapé