-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Update mermaid graph of onigumo processing with a new approach #237
Changes from 5 commits
28b2680
ca1c368
26d560b
a710d41
4ec3ee7
96969a7
30065e1
File filter
Filter by extension
Conversations
Jump to
Diff view
Diff view
There are no files selected for viewing
Original file line number | Diff line number | Diff line change | ||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
@@ -16,27 +16,47 @@ The flowchart below illustrates the flow of data between those parts: | |||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
```mermaid | ||||||||||||||||||||||||||||||||||||
flowchart LR | ||||||||||||||||||||||||||||||||||||
start([START]) --> onigumo_operator[OPERATOR] | ||||||||||||||||||||||||||||||||||||
onigumo_operator -- <hash>.urls ---> onigumo_downloader[DOWNLOADER] | ||||||||||||||||||||||||||||||||||||
onigumo_downloader -- <hash>.raw ---> onigumo_parser[PARSER] | ||||||||||||||||||||||||||||||||||||
onigumo_parser -- <hash>.json ---> onigumo_operator | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
onigumo_operator <-.-> spider_operator[OPERATOR] | ||||||||||||||||||||||||||||||||||||
onigumo_parser <-.-> spider_parser[PARSER] | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
onigumo_operator --> spider_materialization[MATERIALIZER] | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
subgraph "Onigumo (kernel)" | ||||||||||||||||||||||||||||||||||||
onigumo_operator | ||||||||||||||||||||||||||||||||||||
onigumo_downloader | ||||||||||||||||||||||||||||||||||||
onigumo_parser | ||||||||||||||||||||||||||||||||||||
end | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
subgraph "Spider (application)" | ||||||||||||||||||||||||||||||||||||
spider_operator | ||||||||||||||||||||||||||||||||||||
spider_parser | ||||||||||||||||||||||||||||||||||||
spider_materialization | ||||||||||||||||||||||||||||||||||||
subgraph Crawling | ||||||||||||||||||||||||||||||||||||
direction BT | ||||||||||||||||||||||||||||||||||||
spider_parser(🕷️ PARSER) | ||||||||||||||||||||||||||||||||||||
spider_operator(🕷️ OPERATOR) | ||||||||||||||||||||||||||||||||||||
onigumo_downloader[DOWNLOADER] | ||||||||||||||||||||||||||||||||||||
end | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
start([START]) --> onigumo_feeder[FEEDER] | ||||||||||||||||||||||||||||||||||||
onigumo_feeder -- .raw --> Crawling | ||||||||||||||||||||||||||||||||||||
onigumo_feeder -- .urls --> Crawling | ||||||||||||||||||||||||||||||||||||
onigumo_feeder -- .json --> Crawling | ||||||||||||||||||||||||||||||||||||
Crawling --> spider_materializer(🕷️ MATERIALIZER) | ||||||||||||||||||||||||||||||||||||
spider_materializer --> done([END]) | ||||||||||||||||||||||||||||||||||||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more.
Suggested change
I‘d split this into smaller groups. |
||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
spider_operator -. "<hash>.urls" .-> onigumo_downloader | ||||||||||||||||||||||||||||||||||||
onigumo_downloader -. "<hash>.raw" .-> spider_parser | ||||||||||||||||||||||||||||||||||||
spider_parser -. "<hash>.json" .-> spider_operator | ||||||||||||||||||||||||||||||||||||
``` | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. We were thinking about adding some title to the second diagram. But I don’t know what it should say. |
||||||||||||||||||||||||||||||||||||
```mermaid | ||||||||||||||||||||||||||||||||||||
flowchart LR | ||||||||||||||||||||||||||||||||||||
subgraph "🕷️ Spider" | ||||||||||||||||||||||||||||||||||||
direction TB | ||||||||||||||||||||||||||||||||||||
spider_parser(PARSER) | ||||||||||||||||||||||||||||||||||||
spider_operator(OPERATOR) | ||||||||||||||||||||||||||||||||||||
spider_materializer(MATERIALIZER) | ||||||||||||||||||||||||||||||||||||
end | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
subgraph Onigumo | ||||||||||||||||||||||||||||||||||||
onigumo_feeder[FEEDER] | ||||||||||||||||||||||||||||||||||||
onigumo_downloader[DOWNLOADER] | ||||||||||||||||||||||||||||||||||||
end | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
onigumo_feeder -- .json --> spider_operator | ||||||||||||||||||||||||||||||||||||
spider_operator ---> spider_materializer | ||||||||||||||||||||||||||||||||||||
onigumo_feeder -- .urls --> onigumo_downloader | ||||||||||||||||||||||||||||||||||||
onigumo_feeder -- .raw --> spider_parser | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
spider_parser -. "<hash>.json" .-> spider_operator | ||||||||||||||||||||||||||||||||||||
onigumo_downloader -. "<hash>.raw" .-> spider_parser | ||||||||||||||||||||||||||||||||||||
spider_operator -. "<hash>.urls" .-> onigumo_downloader | ||||||||||||||||||||||||||||||||||||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more.
Suggested change
See my comment from my previous review. I’d push the |
||||||||||||||||||||||||||||||||||||
``` | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
### Operator ### | ||||||||||||||||||||||||||||||||||||
|
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
I like the idea of using the emoji to get around GitHub not supporting fontawesome icons in Mermaid diagrams. 💪🏻