segunda-feira, 28 de dezembro de 2015

Tableau - Table Calculations

No artigo de hoje falaremos um pouco sobre cálculos no Tableau, mais especificamente sobre o recurso Table Calculations.

Esta funcionalidade muito fácil de ser utilizada, permite com poucos cliques, criarmos cálculos avançados como: Percentuais do Total, Rank, Média Móvel, Acumulados, Percentil entre outros.




Para ilustrar nossos exemplos, utilizarei a base de dados que acompanha o Tableau, com a ferramenta Tableau Public. Criei a seguinte análise que servirá para validação de nossos cálculos, com os atributos Categoria e Região nas linhas, e Ano e Trimestre nas colunas. Também habilitei todos os totais para que possamos validar os números.



Dupliquei a planilha, e com um clique na métrica, Add Table Calculation ou Quick Table Calculation conseguimos rapidamente adicionar um Cálculo de Tabela. Escolhi, para nosso exemplo, a função Running Sum, que fará o cálculo acumulado dos valores. Repare que, defni, no caso de acumulado, a função de somatória, poderia ser a média por exemplo. Também preciso definir o nível do cálculo, defini em um primeiro instante Célula, que é a menor unidade, neste caso os valores baterão com a planilha de validação em todas as células.



Depois possuímos diversas opções para definição do nível do cálculo, que vão desde a definição dos atributos propriamente ditos como as opções abaixo:
  • Table Across
  • Table Down
  • Table Across the Down
  • Table Down the Across
  • Pane Across
  • Pane Down
  • Pane Across the Down
  • Pane Down the Across

Abaixo explicaremos as opções:

1 - Table Across - Realiza a soma horizontalmente da esquerda para a direita, por linha, do primeiro trimestre de 2011 até o quarto trimestre de 2012. Se comparar o valor deste último trimestre 571.026 é o mesmo do Grand Total da linha na planilha da validação.



2 - Pane Across - Realiza a soma horizontalmente da esquerda para a direita, por linha, quebrando por ano. Se comparar o valor do último trimestre de 2011, 293.973 é o mesmo do Total da primeira linha de 2011 na planilha de validação.


3 - Table Down - Realiza a soma vertical de cima para baixo de cada trimestre em todas as regiões em todas categorias. Se comparar o valor final do primeiro trimestre, 696.446 é o mesmo do total da primeira coluna de 2011 na planilha de validação.



4 - Pane Down - Realiza a soma vertical de cima para baixo de todas as regiões, por trimestre, em cada categoria. Se comparar o valor da última região, do primeiro trimestre, na categoria Material de Escritório, 232.558 é o mesmo do total da planilha de validação.



5 - Table Across the Down - Realiza a soma de toda a planilha. A ordem começa horizontalmente na primeira linha, da esquerda para a direita, de T1 2011 até T4 2012, indo em seguida para a segunda linha, da esquerda para a direita, de T1 2011 até T4 2012, repetindo o acumulado nessa ordem da primeira região da primeira categoria em T1 2011 até a última região da segunda categoria em T4 2012. Se você comparar o Grand Total 4.661.999 da planilha de validação é igual ao último valor calculado no Table Calculation.


6 - Table Down the Across, Panel Across the Down, Panel Down the Across - Repetem a lógica acima, levando em consideração se é tabela inteira ou apenas o ano. 
Além do nível de cálculo, você pode utilizar diversos tipos de cálculos disponíveis pela ferramenta, por exemplo, percentual do total (Pane Down - Região dentro da Categoria no Trimestre)


Rank (Pane Down)



Moving Average - Média Móvel dos últimos 6 meses


Maiores informações na base de conhecimento da Tableau:


http://onlinehelp.tableau.com/current/pro/online/en-us/help.htm#calculations_tablecalculations_understanding_addressing.html

Por hoje é isso. Um abraço pessoal e uma boa noite.

Fabio Idalgo

4 comentários:

  1. Fabio, pela sua experiência, bases de dados não tão grandes, em torno de 100Gb, aconselha criar um DW e o Tableau buscar somente os dados no DW ou buscar diretamente no transacional ?

    ResponderExcluir
  2. Helvio, muito obrigado pelo estrear os comentários do blog.
    A questão é, sua base do transacional tem 100Gb, porém você não irá colocar 100% das informações no Tableau. Geralmente você irá retirar uma pequena parte desses dados, que será muito inferior a 100Gb.
    Por exemplo, tabela de nota fiscal, itens, produtos, clientes, trazendo somente os campos necessários para análises e dashboards de faturamento.
    Na arquitetura convencional sempre um Datawarehouse é muito bem vindo, porém no Tableau você pode criar Extracts diretamente do transacional, agendados para o período noturno por exemplo, contendo apenas o que interessar a você desses dados. Este extract ficará off-line e poderá ser D-1 ou M-1, e você ficará surpreso com o pequeno tamanho desses arquivos de Extracts.
    Você pode ter outras versões dos dashboards das vendas online somente do dia atual, sendo conexão live. Claro que sempre tem a questão da concorrência, mas por experiência não costuma onerar. Dessa forma o histórico é off-line, e o corrente, do dia atual, é online.
    Uma outra dica, somente para casos de Extracts muito grandes, é usar ao invés do modo gráfico de tabelas no Tableau, criar Selects já agregados com Sum e Group By, ou ferramentas como Alteryx para pré-agregar esses dados, diminuindo assim a volumetria e o tamanho do extract, além de trazer somente os campos necessários.
    Espero que tenha ajudado. Um abraço
    Fabio

    ResponderExcluir
  3. Fabio, muito grato pelas informações. Estou baixando o Alteryx, pois ainda não utilizei e percebi que ele trabalha junto com o Tableau, até então usava o PDI (Kettle) gravando num banco mysql, mas não estou muito satisfeito com esse modelo.

    ResponderExcluir
    Respostas
    1. Que isso Helvio, eu que agradeço pela interação no blog e pela troca de informações. O PDI tem um componente no
      Marketplace chama Tableau Data Extract. Eu o utilizei em um projeto e posteriormente pretendo escrever um artigo.

      Mais detalhes em http://www.inquidia.com/news-and-info/tableau-data-extract-output-plugin-pentaho-data-integration-now-available

      Este componente você consegue fazer um output direto em um arquivo extract do Tableau, ao invés de sua base MySql, eliminando assim a necessidade de uma camada intermediária de Datawarehouse ou Datamart.

      Porém o Alteryx até onde sei é uma ferramenta mais completa para trabalhar com o Tableau.

      Um abraço

      Excluir