Curso: Spark - Distribuição e Processamento de Dados

    Modalidade: Autoinstrucional

    Carga Horária: 36h

    Conteudista: Carlos Manuel Dias Viegas

    Edição Final: Assessoria de EaD do Programa Justiça 4.0

    Público - Alvo: Magistrados(as), Servidores(as) do Poder Judiciário e público em geral.

    Pré-Requisitos: Conhecimentos do sistema operacional GNU/Linux ou Unix (noções de utilização de terminal shell, de variáveis de ambiente de sistema, de comunicação em rede com utilização de ssh) e conhecimentos em linguagem
    Pyton.

    Obejtivo: Capacitar o(a) cursista a utilizar as soluções Apache Hadoop e Apache Spark para o desenvolvimento de aplicações para resolução de problemas na área da Ciência de Dados. Realizar tarefas de implantação, configuração, e integração de dados em cluster. Ao final do curso, o(a) cursista terá como habilidades principais a capacidade para planejar e preparar a infraestrutura de dados de uma organização, podendo projetar, construir, integrar e manter banco de dados ou outras fontes de dados, bem como conhecer as técnicas e ferramentas para o desenvolvimento de aplicações com Apache Spark para o processamento de dados em larga escala.

    Carga horária: 36 horas
    Conteúdo programático:

    Apache Hadoop;

     Apache Spark;

     Apache Spark - SparkSQL;

    Apache Spark – MLlib;

    Apache Spark - Streaming;

    Apache Spark - Spark R;

    Apache Spark - GraphX;