Curso: Spark - Distribuição e Processamento de Dados
Modalidade: Autoinstrucional
Carga Horária: 36h
Conteudista: Carlos Manuel Dias Viegas
Edição Final: Assessoria de EaD do Programa Justiça 4.0
Público - Alvo: Magistrados(as), Servidores(as) do Poder Judiciário e público em geral.
Pré-Requisitos: Conhecimentos do sistema operacional GNU/Linux ou Unix (noções de utilização de terminal shell, de variáveis de ambiente de sistema, de comunicação em rede com utilização de ssh) e conhecimentos em linguagem
Pyton.
Obejtivo: Capacitar o(a) cursista a utilizar as soluções Apache Hadoop e Apache Spark para o desenvolvimento de aplicações para resolução de problemas na área da Ciência de Dados. Realizar tarefas de implantação, configuração, e integração de dados em cluster. Ao final do curso, o(a) cursista terá como habilidades principais a capacidade para planejar e preparar a infraestrutura de dados de uma organização, podendo projetar, construir, integrar e manter banco de dados ou outras fontes de dados, bem como conhecer as técnicas e ferramentas para o desenvolvimento de aplicações com Apache Spark para o processamento de dados em larga escala.
Apache Hadoop;
Apache Spark;
Apache Spark - SparkSQL;
Apache Spark – MLlib;
Apache Spark - Streaming;
Apache Spark - Spark R;
Apache Spark - GraphX;