Semantix: Top 8 bibliotecas Python de Machine Learning
Escolha uma Página
Top 8 bibliotecas Python de Machine Learning
18 de dezembro de 2018

O Python continua a liderar quando se trata de tarefas de Machine Learning, Inteligência Artificial, Deep Learning e Ciência de Dados. De acordo com a builtwith.com, 45% das empresas de tecnologia preferem usar o Python para implementar IA e Machine Learning.

1- scikit-learn (Colaboradores: 1175, Commits: 23301, Avaliações: 30867)

Scikit-learn é um módulo Python para Machine Learning baseado em NumPy, SciPy e matplotlib. Ele fornece ferramentas simples e eficientes para mineração e análise de dados. O SKLearn é acessível a todos e reutilizável em diversos contextos.

2- Keras (Colaboradores: 726, Commits: 4818, Avaliações: 34066)

Keras é uma API de redes neurais de alto nível, escrita em Python e capaz de rodar em cima do TensorFlow, CNTK ou Theano. Foi desenvolvida com foco em permitir a experimentação rápida. Ser capaz de ir da ideia ao resultado com o menor atraso possível é a chave para fazer uma boa pesquisa.

3- XGBoost (Colaboradore: 319, Commits: 3454, Avaliações: 13630)

XGBoost é uma biblioteca de otimização de gradiente otimizada e projetada para ser altamente eficiente, flexível e portátil. Ela implementa algoritmos de Machine Learning sob a estrutura Gradient Boosting. O XGBoost fornece um reforço (também conhecido como GBDT, GBM) que resolve muitos problemas de ciência de dados de maneira rápida e precisa. O mesmo código é executado no principal ambiente distribuído (Hadoop, SGE, MPI).

4- StatsModels (Colaboradores: 162, Commits: 10837, Avaliações: 3275)

O Statsmodels é um pacote Python que fornece um complemento ao scipy para cálculos estatísticos, incluindo estatística descritiva, estimativa e inferência para modelos estatísticos.

5- LightGBM (Colaboradores: 91, Commits: 1272, Stars: 6736)

Uma estrutura de aprimoramento de gradiente (GBDT, GBRT, GBM ou MART) rápida, distribuída e de alto desempenho baseada em algoritmos de decisão, usada para classificação e muitas outras tarefas de Machine Learning. Está sob a proteção do projeto DMTK (http://github.com/microsoft/dmtk) da Microsoft.

6- CatBoost (Colaboradores: 77, Commits: 3304, Avaliações: 3241)

CatBoost é um método de Machine Learning baseado no aumento de gradiente sobre árvores de decisão. Algumas das principais vantagens do CatBoost são: qualidade superior quando comparada com outras bibliotecas GBDT, melhor velocidade de inferência, suporte para recursos numéricos e categóricos, e ferramentas de visualização de dados incluídas.

7- PyBrain (Colaboradores: 32, Commits: 992, Avaliações: 2598)

PyBrain é uma biblioteca modular de Machine Learning para Python. Seu objetivo é oferecer algoritmos flexíveis, fáceis de usar e ainda assim poderosos para tarefas de aprendizado de máquina e uma variedade de ambientes predefinidos para testar e comparar seus algoritmos.

8- Eli5 (Colaboradores: 6, Commits: 929, Avaliações: 932)

O ELI5 é um pacote Python que ajuda a depurar os classificadores de Machine Learning e explica suas previsões. Ele fornece suporte para os seguintes frameworks e pacotes: scikit-learn, XGBoost, LightGBM, lightning e sklearn-crfsuite.

Fonte: KDnuggets  

0 comentários

Trackbacks/Pingbacks

  1. Os 10 melhores apps para cientistas de dados - Semantix - […] ciência de dados e o aprendizado de máquina estão evoluindo com suas habilidades de transformar o mundo ao seu…
  2. A Ciência por trás da extração de dados - Semantix - […] onde está e como coletá-lo. Este é o primeiro passo da extração de dados. Usando código em Python ou…

Enviar um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *