Com todo o burburinho em torno do sucesso do aprendizado de máquina na descoberta de novos medicamentos e na capacitação de carros autônomos, a expectativa é que ele esteja disponível e tenha um preço acessível. Se pode resolver esses grandes problemas, deve ser fácil de aplicar a algo menor.

Lembro-me da empolgação durante minha graduação quando aprendi sobre comprar seguidores no instagram. Em jovens mentes turbulentas, todos os problemas tinham uma solução, e essa solução eram redes neurais profundas. A experiência me ensinou o contrário – se não forem usados ​​corretamente, os próprios algoritmos de aprendizado de máquina se transformam em um problema.

Enquanto escrevia o artigo, me deparei com esta postagem do LinkedIn traçando a diferença entre duas equipes de aprendizado de máquina que abordam o mesmo problema – uma correndo para trazer uma solução de aprendizado de máquina a todo custo e outra dedicando tempo para entender o problema. Sou um grande fã da segunda abordagem.

Este artigo é um resumo das áreas nas quais presto atenção ao decidir se devo prosseguir com uma solução de aprendizado de máquina. Com tudo isso dito, vamos mergulhar!

comprar seguidores no instagram

Problema

O problema é adequado para aprendizado de máquina?

O aprendizado de máquina pode ser visto de vários ângulos e, em um mundo simplificado, é uma ferramenta que aprende padrões a partir dos dados de treinamento, úteis para fazer previsões em exemplos de teste invisíveis.

Naturalmente, os padrões nos dados podem ser simples o suficiente para serem quebrados com um conjunto de regras ou uma solução analítica. Por exemplo, a previsão do próximo nascer do sol pode ser feita facilmente com uma solução analítica guiada por um conjunto de regras físicas. Nesses casos, uma solução de aprendizado de máquina seria um exagero.

Ao mesmo tempo, os padrões podem ser muito complexos para os modelos atuais. Esse é um problema de tradução automática, em que, para ir além do simples mapeamento de dicionário e atingir um desempenho de nível humano, um enorme corpus de ampla informação sobre o mundo precisa ser incorporado ao modelo.

Um problema de ponto ideal seria uma tarefa muito específica com um conjunto fixo de opções de saída e um objetivo claro, onde existe um padrão claro que pode ser aprendido – classificação de imagem ou texto, aprimoramento de imagem, mapeamento de voz para texto.

Dados

Existem dados suficientes? Os dados são de qualidade razoável?

Talvez o principal obstáculo ao desenvolvimento de soluções de alta qualidade seja a falta de uma quantidade suficiente de dados de alta qualidade. Para muitos problemas, os dados precisam ser minerados – criando um mercado para ferramentas de mineração de dados, como o Amazon Mechanical Turk. Idealmente, os dados precisam ser balanceados, versáteis, heterogêneos e bem rotulados.

Se o conjunto de dados consistir em 1000 imagens de gatos e dez imagens de cães, é muito provável que o modelo simples não seja capaz de capturar a distribuição dos cães. Nesse caso, são normalmente usados ​​modelos que podem ser treinados em dados não balanceados. Os dados precisam ter uma boa seleção de raças de cães e gatos para que o modelo aprenda as características comuns. Cães erroneamente rotulados como gatos confundiriam o modelo.

Custo

comprar seguidores no instagram

Os custos de desenvolvimento e manutenção podem ser sustentados?

Custo de desenvolvimento

Existem vários aspectos que são muito caros no desenvolvimento de soluções de aprendizado de máquina – equipe, hardware e dados.

Como em muitos problemas, as pessoas são cruciais para o sucesso. Os melhores engenheiros de aprendizado de máquina têm diplomas de alto nível com suas habilidades em alta demanda, o que significa que seu custo será excepcionalmente alto. O salário médio de um engenheiro de ML no Reino Unido é de 60k £.

As pessoas não são a única despesa – os modelos de aprendizado de máquina precisam ser treinados em hardware especializado. As startups costumam obter centenas de milhares de créditos de gigantes da tecnologia para usar em hardware. No entanto, raramente é o caso de empresas estabelecidas, o que significa que elas mesmas precisariam pagar por isso.

Finalmente, dados … Se não tivermos acesso a dados gratuitos, eles precisarão ser minerados. Uma única resposta no Amazon Mechanical Turk, para uma tarefa muito simples de rotulagem com um único clique, custaria cerca de US $ 0,05. Para obter um conjunto de dados bem rotulado com 1.000.000 de imagens, teríamos que pagar $ 50k. E isso é uma tarefa muito simples, com um clique. Para problemas mais complexos, o custo pode facilmente ultrapassar US $ 100 mil.

Custo de manutenção

Os modelos de aprendizado de máquina precisam de manutenção para garantir que o modelo que orienta suas decisões esteja atualizado com a distribuição de dados atual. Isso significa que você idealmente precisaria de um engenheiro para mantê-lo. Os principais produtos geralmente permanecem no ciclo de feedback iterativo.

O hardware no qual o modelo deve ser implantado (por exemplo, nuvem) também precisa ser pago. E o custo aumentaria vertiginosamente com a expansão dos negócios. A distribuição da carga de trabalho pode ser um desafio – máquinas insuficientes significaria atrasos no processamento da solicitação. Muitas máquinas e o custo aumentariam.

Tempo de desenvolvimento

Você pode pagar pelo menos meio ano para resolver um problema?

Se a solução não estiver disponível imediatamente, como serviços fornecidos pelo Google / Amazon / Microsoft, o tempo de desenvolvimento e implantação pode ser bastante longo. Para soluções de longo prazo, você precisa ter pipelines de dados, treinamento e teste estabelecidos.

O desenvolvimento é um processo iterativo. Do meu pessoal experiência de um mês é necessária para configurar um modelo muito simples. A coleta de dados e a limpeza realizadas em paralelo levariam aproximadamente o mesmo tempo. O treinamento simples e o pipeline de implantação também levariam cerca de um mês.

A complexidade geralmente é adicionada de forma iterativa – a cada etapa do modelo, o pipeline de dados está se tornando mais sofisticado e, portanto, precisaria ser mantido ativamente. Dependendo do aplicativo, pode haver dezenas de iterações antes que a solução seja realmente alcançada.

Explicabilidade

Saber como o algoritmo chegou à solução é essencial para a aplicação?

Embora não seja tão importante para muitos aplicativos não essenciais, entender como os algoritmos de ML chegam a conclusões pode ser útil. Por exemplo, a descoberta de medicamentos se beneficiaria muito com a explicabilidade, pois obteríamos dicas sobre os padrões que orientam as descobertas bem-sucedidas.

Em situações críticas para a vida, a explicabilidade é essencial – no diagnóstico de doenças com modelos de aprendizado de máquina, é essencial saber como e por que o modelo chegou à conclusão para garantir que o paciente não seja maltratado. Compreender como os carros autônomos tomam decisões também é importante para garantir que nenhuma correlação espúria seja aprendida que possa resultar em acidentes nas estradas.

Ética

O seu modelo está tomando decisões que podem discriminar os usuários finais?

O infame twitter bot que num piscar de olhos se transformou em um idiota racista é um bom, mas provavelmente raramente, exemplo explícito de como uma modelo pode dar uma virada errada. Muitos dos modelos empregados na prática têm um viés latente que muitas vezes é muito difícil de identificar.

Em alguns casos, esse viés pode não ser um grande problema – por exemplo, um chat-bot que aprendeu a ser mais legal durante a tarde (talvez treinado em um conjunto de dados com timestamps – as pessoas tendem a ser um pouco mais legais depois de almoçar ) Por outro lado, um chat-bot que é mais amigável com as mulheres do que com os homens seria bastante preocupante, mas difícil de diagnosticar o problema. Normalmente, os preconceitos apontam para problemas sérios nos dados de treinamento.

Tempo de processamento

O aplicativo precisa ser executado em tempo real?

Muitos algoritmos de aprendizado de máquina, devido à sua complexidade, teriam dificuldade em atingir os desempenhos de tempo exigidos por alguns aplicativos. Modelos pesados ​​que têm um bom desempenho em termos de precisão exigiriam uma quantidade substancial de computação e memória.

Dois exemplos em que o aprendizado de máquina seria desafiador de implementar são negociação de alta frequência e computação gráfica. Nesses dois casos, a velocidade é tão importante que geralmente são empregadas heurísticas simples.

Os telefones celulares são outro exemplo em que a implementação de uma solução de aprendizado de máquina pode ser um desafio devido aos recursos escassos. Essa é a razão pela qual muitos telefones celulares estão introduzindo Unidades de Processamento Neural (NPUs) – permitindo que os modelos sejam colocados em dispositivos móveis.

Conclusão

Há uma razão pela qual os alunos de graduação em seu último ano são desencorajados a fazer projetos de aprendizado de máquina – é simplesmente muito arriscado. As universidades passaram por todas as armadilhas antes de aprender que isso expõe o projeto a riscos óbvios.

Ouvir isso de um engenheiro de aprendizado de máquina pode soar como um agente de seguros que o convence a não aceitar seus serviços. Mas, neste caso, a honestidade é a melhor política. Afinal, é muito fácil queimar toneladas de dinheiro seguindo o hype que na verdade não é pior.

Para aqueles que são corajosos o suficiente para começar um projeto de ML, confira meu artigo recente sobre as ferramentas que achei particularmente úteis para gerenciar projetos de IA.

Se você gostou deste artigo, compartilhe com um amigo! Para ler mais sobre os tópicos de aprendizado de máquina e processamento de imagem, clique em inscrever-se!

Eu perdi alguma coisa? Não hesite em deixar uma nota, comentário ou mensagem diretamente!

Discussion

Testimonials

“Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.”

avada-taxi-testimonial-1

Mike Smith – Brooklyn, NY

Related Posts

If you enjoyed reading this, then please explore our other articles below:

Back to News

Don’t want to use the app?

No problem, book online or give us a call!

BOOK ONLINE
CALL TO BOOK
BOOK ONLINE
CALL TO BOOK