Glossário Data Science: conheça os principais termos utilizados na área
Rick Drumond

Glossário Data Science: conheça os principais termos utilizados na área

Entender um pouco mais sobre o Data Science se mostra imprescindível em tempos onde chega a ser incontável o número de dados gerados todos os dias. Não importa se você possui capacitação técnica para isso ou se gerencia uma equipe, o fato é que o Data Science é uma realidade assim como sua vasta termologia.

Exatamente por isso, vamos fazer aqui um glossário do Data Science, ou seja, um guia com termos que são comumente utilizados na área e que virão acompanhados de suas explicações.

O que é Data Science?

Antes de adentrarmos no glossário, porém, precisamos contextualizar o Data Science em si.

Data Science, nada mais é que o estudo de todos estes dados que nos referimos acima, entretanto, a forma como esse estudo é realizado não é aleatória.

Basicamente, os dados estudados se referem, de alguma forma, à determinado nicho, empresa ou mesmo sobre informações específicas. Sendo assim, um Data Scientist é obrigado a lidar com estatísticas, matemática e computação, além de ter conhecimento do tema no qual estão baseados os dados estudados…sem essas habilidades, o Data Science simplesmente não acontece.

E já que falamos do Data Scientist, é importante ressaltar que faz parte do seu trabalho formular problemas, hipóteses e soluções através da assimilação de todos os dados colhidos e analisados. Posteriormente, este profissional deve transformar este estudo em produtos, serviços ou informações dentro de uma empresa.

Compreendido o conceito do Data Science podemos partir para o seu glossário. Vamos lá?

  •         Algoritmo – o algoritmo é uma fórmula matemática executada para analisar dados. Trata-se de uma sequência lógica definida com foco na resolução de um problema ou mesmo para a execução de determinada tarefa. De forma simplificada, ele realiza muitos cálculos de forma rápida e certeira na busca por determinada estatística ou dado;
  •         AWS – a AWS, ou Amazon Web Services, é uma plataforma de serviços na nuvem considerada como sendo uma das mais seguras do mundo. Além disso, oferece uma série de serviços como comércio eletrônico, banco de dados e muitos outros;
  •         BI – o BI, ou Business Inteligence é a coleta e análise de dados com o foco exclusivo no apoio à tomada de decisões e na gestão de empresas;
  •         Analytics – o Analytics, é outro conjunto de dados que ajuda os gestores nas tomadas de decisões e gerenciamento de suas empresas;
  •         Dados estruturados – são os dados que possuem um tipo de organização que segue uma lógica específica e que por isso, tende a facilitar o trabalho deixando-o linear. Em geral, são encontrados em colunas ou linhas por exemplo;
  •         Dados não estruturados – por outro lado, este tipo de dado não segue lógicas o que acaba dificultando a interpretação dos dados por caber diversas variáveis diferentes. Neste caso, um bom exemplo seria as interações dentro das redes sociais;
  •         Data cleansing – o data cleansing é um procedimento que tem como objetivo retirar do banco de dados informações que possam estar corrompidas ou que não sejam exatas;
  •         Data lake – data lake é um termo utilizado para definir uma infinidade de dados exatamente no tipo de fonte original, ou seja, são os dados que ainda não foram desvendados ou alterados…seguem seus padrões e formatos originais;
  •         Escalabilidade – usualmente, escalabilidade é quando uma empresa consegue manter a qualidade do seu serviço e a sua estrutura mesmo que seu fluxo de trabalho aumente. Dentro do Data Science, a definição é a mesma, entretanto, é um sistema que consegue lidar com um crescente número de dados sem que sua performance seja afetada;
  •         IOT – Internet das Coisas, ou IOT, é a capacidade de melhorar as “coisas” que já existem fazendo com que elas passem a interagir com as pessoas. Essa melhora é possível devido ao recolhimento e análise de dados;
  •         Metadata – os metadados são dados que se decorrem de outros dados, ou seja, eles são capazes de explicar um conjunto de dados específicos;
  •         Data mining – o data mining, que em português significa “mineração de dados”, é a procura de informações relevantes dentro de grandes quantidades de dados;
  •         Machine learning – como o nome diz, trata-se de um processo onde se ensina a máquina através de diversos algoritmos à realizar determinadas tarefas. Nestes casos, cada vez que essa máquina realiza a tarefa aprendida, melhor é o seu desempenho.

Embora tenhamos listado alguns dos termos mais utilizados no Data Science, existem muitos outros, mas para isso, teremos que nos aprofundar mais tecnicamente…o que faremos logo mais.

De qualquer forma, caso possa surgir alguma dúvida sobre nosso glossário, deixe seu comentário…ah, e se você conhece algum termo que não incluímos neste artigo, nos ajude a escrever o próximo…

Até a próxima!


Anterior: As principais linguagens de programação e suas aplicações Próximo: Como manter a saúde financeira da sua startup?

Sem Comentário

Deixe seu comentário

Deixe seu comentário

Pular para a barra de ferramentas