Data cloud #2

emphasis87 · 2017-03-16T23:32:38Z

Decide techniques used to transfer data required for jobs between clients. Bittorrent seems promising, but I am not sure as to how fast is initialization and how costly is peer searching and communication overhead. Also check how Hadoop does it. How saturated should a mesh be? There should be some mechanism for labeling data with rareness or reproducibility and cost. This can perhaps be determined by run jobs' requirements to some extent. How should data be addressed and catalogued? Also, NSQ uses snappy or deflate for message compression, but perhaps zstd may perform better, or decide based on data usage frequency.

emphasis87 added the idea label Mar 16, 2017

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Data cloud #2

Data cloud #2

emphasis87 commented Mar 16, 2017 •

edited

Loading

Data cloud #2

Data cloud #2

Comments

emphasis87 commented Mar 16, 2017 • edited Loading

emphasis87 commented Mar 16, 2017 •

edited

Loading