Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Merging 2 datasets of dataset.big #4

Open
ppKrauss opened this issue Nov 6, 2017 · 0 comments
Open

Merging 2 datasets of dataset.big #4

ppKrauss opened this issue Nov 6, 2017 · 0 comments

Comments

@ppKrauss
Copy link
Contributor

ppKrauss commented Nov 6, 2017

A carga automática de diversas planilhas pode ser relevante para a automação de processos, mas o processo só termina quando os dados estiverem agregados.
Existem duas situações:

  1. o nome da planilha em si é um dado: precisa ser agregado por exemplo como primeiro campo.

    1.1. além disso o nome entra na composição da chave primária.

  2. o nome não traz informação alguma ao dataset.

Algoritmos que podem resolver o problema:

  • para o caso-2, basta renomear o dataset conferindo simultaneamente se não houve duplicação, ou disparando o tratamento delas (ex. deletando duplicados).

  • para o caso-1, além de renomear, levar o nome ou uma transformação do nome para um campo inicial ou final (ver função jsonb_insert()). Requer acrescimento também nos metadados. Para o caso 1.1 há que se alterar também o metadado da PK.

@ppKrauss ppKrauss changed the title Agregando datasets como se fosse um único original Merging 2 datasets of dataset.big Nov 6, 2017
ppKrauss added a commit that referenced this issue Nov 12, 2017
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant