Skip to content

Commit

Permalink
+ 翠微居 + misc fix
Browse files Browse the repository at this point in the history
  • Loading branch information
kanasimi committed Oct 16, 2023
1 parent a6a71d0 commit 64073a7
Show file tree
Hide file tree
Showing 13 changed files with 125 additions and 105 deletions.
4 changes: 2 additions & 2 deletions arrangement/classify_and_compress.js
Original file line number Diff line number Diff line change
Expand Up @@ -517,13 +517,13 @@ function classify(fso_name, fso_path, fso_status, sub_fso_list) {
return;
}

if (/[\[((【](?:18禁ゲーム|ACT|ADV|RPG|SLG|3D|PL\])/i.test(fso_name)
if (/[\[((【](?:18禁ゲーム|ACT|ADV|RPG|SLG|3D|PL)\]/i.test(fso_name)
|| /パッケージ版|修正パッチ|予約特典|本編同梱|\+ ?update/i.test(fso_name)) {
move_to('game');
return;
}

if (/[\[((【](?:(?:同人)?ゲームCG|Game CG|HCG)/i.test(fso_name)) {
if (/[\[((【](?:18禁ゲーム ?CG|(?:同人)?ゲームCG|Game CG|HCG)/i.test(fso_name)) {
move_to('game_CG');
return;
}
Expand Down
1 change: 1 addition & 0 deletions comic.cmn-Hans-CN/baozimh.org.js
Original file line number Diff line number Diff line change
Expand Up @@ -10,6 +10,7 @@ require('../work_crawler_loader.js');

var crawler = new CeL.work_crawler({
// 2023/6/16: https://baozimh.org/
// 2023/9/1 前網站改版為手機友好外觀
base_URL : 'https://baozimh.org/',

// 最小容許圖案檔案大小 (bytes)。
Expand Down
2 changes: 1 addition & 1 deletion comic.cmn-Hans-CN/baozimh_cn.js
Original file line number Diff line number Diff line change
Expand Up @@ -13,7 +13,7 @@ CeL.run('application.net.work_crawler.sites.baozimh');
// ----------------------------------------------------------------------------

var crawler = new CeL.baozimh({
// https://cn.baozimh.com/ , https://cn.webmota.com/
// 2022: https://cn.baozimh.com/ , https://cn.webmota.com/
// 2022/11/19 已採用 Cloudflare 的阻斷服務攻擊保護。
base_URL : 'https://cn.baozimh.com/'
});
Expand Down
3 changes: 2 additions & 1 deletion comic.cmn-Hans-CN/gufengmh.js
Original file line number Diff line number Diff line change
Expand Up @@ -28,7 +28,8 @@ var crawler = CeL.SinMH({
// 2018/3/7 改變網址: http://www.gufengmh.com/ → https://www.gufengmh8.com/
// 2021/12/27–2022/7/12 網址: https://www.gufengmh9.com/
// 2022/7/16– : → https://www.123gf.com/
base_URL : 'https://www.123gf.com/',
// 2023/10/14 → https://www.gufengmh.com/
base_URL : 'https://www.gufengmh.com/',

search_URL : 'API',
id_of_search_result : 'slug'
Expand Down
3 changes: 2 additions & 1 deletion comic.cmn-Hans-CN/mh1234.js
Original file line number Diff line number Diff line change
Expand Up @@ -30,7 +30,8 @@ var crawler = CeL.SinMH({
// https://www.mh1234.com/assets/d74ff3d8/js/theme.js
// Created by Shen.L on 2016/1/28.
// SinMH.initChapter, SinTheme.initChapter, SinConf.resHost
base_URL : 'https://www.mh1234.com/',
// 2023/6/25 前自 https://www.mh1234.com/ 改成 https://www.ymh1234.com/
base_URL : 'https://www.ymh1234.com/',

work_URL : function(work_id) {
return 'comic/' + work_id + '.html';
Expand Down
2 changes: 1 addition & 1 deletion comic.cmn-Hans-CN/weibo.js
Original file line number Diff line number Diff line change
Expand Up @@ -118,7 +118,7 @@ var crawler = new CeL.work_crawler({
&& chapter_data.json_content.page[0].mobileImgUrl) {
CeL.warn([ this.id + ':', {
// gettext_config:{"id":"«$1»-is-a-paid-member-only-work-you-must-purchase-before-reading"}
T : [ '《%1》為會員專屬作品,必須充值後才能閱讀!', work_data.title ]
T : [ '《%1》是付費會員專享作品,您必須購買後才能閱讀!', work_data.title ]
} ]);
return;
}
Expand Down
1 change: 1 addition & 0 deletions document/README.cmn-Hant-TW.md
Original file line number Diff line number Diff line change
Expand Up @@ -90,6 +90,7 @@
| [丫丫电子书](http://www.xshuyaya.net/) | xshuyaya.js | 有一些舊書。 |
| [飞翔鸟中文](https://www.fxnzw.com/) | fxnzw.js | 少了一些新書。資訊來源與飘天文学不同。 |
| [69书吧](https://www.69shu.com/) | 69shu.js | 部分書目資訊來源與飘天文学不同。 |
| [翠微居](https://www.cwjjj.com//) | cwjjj.js | 有些反和諧加料版。 |
| ~~[卡提諾論壇 小說頻道](https://ck101.com/forum.php?gid=1180)~~ | ~~archive/ck101.js~~ | Discuz! X3 可能因[版權問題](https://ck101.com/thread-5106627-1-1.html),自2019-10-01關小說版。 |

* 中國大陸之小說文字常常會被[審查](https://zh.wikipedia.org/wiki/%E4%B8%AD%E5%8D%8E%E4%BA%BA%E6%B0%91%E5%85%B1%E5%92%8C%E5%9B%BD%E8%A8%80%E8%AE%BA%E5%AE%A1%E6%9F%A5)而消失、變造。例如黑名單關鍵字轉為拉丁字母或是[打星號](https://ck101.com/thread-3500214-1-1.html),以及數字 0 改成 o、9 改成 q 等等。有時需要多下載幾個網站的文件再做比較。
Expand Down
4 changes: 2 additions & 2 deletions gui_electron/gui_electron.html
Original file line number Diff line number Diff line change
Expand Up @@ -32,7 +32,7 @@
<div id="operation_panel">
<div>
<div id="download_sites_panel" class="panel">
<h3 id="download_sites_trigger" title="使用網路作品網站(單選)">
<h3 id="download_sites_trigger" title="使用網路小說/漫畫作品網站(單選)">
<span data-gettext="網路作品網站"></span>
</h3>
<div id="download_sites_list"></div>
Expand Down Expand Up @@ -93,7 +93,7 @@ <h3 id="download_job_trigger">
max="99999" min="0" value="500"></input>

<b class="button" onclick="open_DevTools();"> 🐞<!-- 🧪 --> <span
data-gettext="開啟偵錯工具"></span>
data-gettext="開啟偵錯工具/開發人員工具"></span>
</b>

<span id="small_tips"></span>
Expand Down
6 changes: 4 additions & 2 deletions gui_electron/gui_electron_functions.js
Original file line number Diff line number Diff line change
Expand Up @@ -207,6 +207,8 @@ download_sites_set = {

'69shu' : '69书吧',

cwjjj : '翠微居',

daocaoren : '稻草人书屋',
'51shucheng' : '无忧书城',
luoxia : '落霞小说网',
Expand Down Expand Up @@ -1767,7 +1769,7 @@ function reset_favorites(crawler) {
C : 'favorites_button cancel'
} : '', favorites.duplicated > 0 ? [ ' ', {
// gettext_config:{"id":"there-are-$1-duplicate-titles-or-ids-in-the-list"}
T : [ '列表檔案中有%1個重複作品名稱或 id。', favorites.duplicated ]
T : [ '列表檔案中有 %1 個重複作品名稱或🆔。', favorites.duplicated ]
}, {
// 我的最愛
b : [ '🔨', {
Expand Down Expand Up @@ -2192,7 +2194,7 @@ function show_search_result(work_data_search_queue) {
table : node_list
}, {
// gettext_config:{"id":"click-on-the-website-name-to-download-this-work-on-this-website"}
T : '點擊網站名稱可下載此網站之本作品。'
T : '點擊網站名稱即可下載此網站之本作品。'
}, {
br : null
} ];
Expand Down
52 changes: 44 additions & 8 deletions novel.cmn-Hans-CN/69shu.js
Original file line number Diff line number Diff line change
Expand Up @@ -27,7 +27,8 @@ var crawler = new CeL.work_crawler({
// chapter_time_interval : '2s',

// 2018/2/4前: https://www.69shu.com/
base_URL : 'https://www.69shu.com/',
// 2023/8/18前改: https://www.69shuba.com/
base_URL : 'https://www.69shuba.com/',
charset : 'gbk',

// 解析 作品名稱 → 作品id get_work()
Expand All @@ -45,9 +46,16 @@ var crawler = new CeL.work_crawler({

function parse_section(text) {
var matched = text.match(
// <h3><a
// href="https://www.69shu.com/txt/39297.htm">女主从书里跑出来了怎么办</a></h3>
/<a href="[^"]+?\/(\d+)\.htm">([\s\S]+?)<\/a>/);
/**
* <code>
<li>
...
<h3><a target="_blank" href="https://www.69shuba.com/book/47114.htm"><span class="hottext">苟</span><span class="hottext">在</span><span class="hottext">仙</span><span class="hottext">武</span><span class="hottext">娶妻</span><span class="hottext">长生</span></a></h3>
</code>
*/
/<a [^<>]*?href="[^"]+?\/(\d+)\.htm">([\s\S]+?)<\/a>/);
id_list.push(matched[1]);
id_data.push(get_label(matched[2]));
}
Expand All @@ -57,7 +65,16 @@ var crawler = new CeL.work_crawler({
// 直接跳轉到作品資訊頁面。
parse_section(text);
} else {
html.between('<div class="container">').between('<ul>', '</ul>')
/**
* <code>
<!--头部内容结束-->
<div class="container">
<div class="mybox">
<ul class="row">
<li class="col-88">
</code>
*/
html.between('<div class="container">').between('<ul', '</ul>')
//
.each_between('<li>', '<li>', function(text) {
parse_section(text.between('<h3>', '</h3>'));
Expand All @@ -74,9 +91,11 @@ var crawler = new CeL.work_crawler({
},
parse_work_data : function(html, get_label, extract_work_data) {
// console.trace(html);
// <a href="https://www.69shu.com">69书吧</a>
this.site_name = get_label(html.between('<div class="logoimg">')
.between('<a ', '</a>').between('>'));
if (!this.site_name) {
// <a href="https://www.69shu.com">69书吧</a>
this.site_name = get_label(html.between('<div class="logoimg">')
.between('<a ', '</a>').between('>'));
}
var text = html.between('<div class="container">');
// console.log(text);
var work_data = {
Expand All @@ -95,6 +114,13 @@ var crawler = new CeL.work_crawler({
})
};

text = html.between('var bookinfo =', '</script>');
eval('text = ' + text);
// console.trace(text);
Object.assign(work_data, text);
if (!work_data.site_name)
work_data.site_name = work_data.siteName;

// 由 meta data 取得作品資訊。
extract_work_data(work_data, html);

Expand Down Expand Up @@ -161,6 +187,16 @@ var crawler = new CeL.work_crawler({
// 會先以作品標題起頭。
text = CeL.work_crawler.trim_start_title(html, chapter_data);

/**
* <code>
// https://www.69shuba.com/txt/47114/31439934 第1章 老祖又纳妾了
&emsp;&emsp;(本章完)
</code>
*/
text = text.replace(/\(本章完\)\s*$/, '');

// text = CeL.work_crawler.fix_general_ADs(text);

// console.trace([ html, text ]);
Expand Down
122 changes: 43 additions & 79 deletions novel.cmn-Hans-CN/piaotian.js
Original file line number Diff line number Diff line change
Expand Up @@ -224,83 +224,7 @@ crawler = new CeL.work_crawler({
+ /\s*(?:<br\s*\/?>)+/.source), '')
}

// ----------------------------
// 回復被審核屏蔽的文字

text = text

/**
* <code>
// https://www.piaotian.com/html/13/13793/9355310.html 我只想安静的做个苟道中人 第一百七十六章:你想要什么?(第一更!求订阅!)
艹亻尔女马的郑荆山!
扌喿扌喿扌喿!!!
// avoid: "那位少女馬上眼前一亮" 劍仙三千萬-第六十六章武宗
// https://www.piaotian.com/html/13/13793/9355452.html 我只想安静的做个苟道中人 第四十八章:再来一次。(第四更!求订阅!)
接着就开始被厉师姐采衤卜……
// https://www.piaotian.com/html/13/13793/9355454.html 我只想安静的做个苟道中人 第五十章:太刺激了。(第一更!求订阅!)
这是要在光天化日之下里予占戈?
// https://www.piaotian.com/html/13/13793/9355285.html 我只想安静的做个苟道中人 第一百五十一章:厉仙子的大长腿。(第二更!求订阅!)
艹亻也女马白勺!
女干氵?掳掠
女干夫氵女彐
钅肖魂入骨
禁女干乱
那月匈……
</code>
*/
.replace(/亻尔女马/g, '你媽').replace(/亻尔/g, '你').replace(/扌喿/g, '操')
//
.replace(/衤卜/g, '補').replace(/里予占戈/g, '野戰')
//
.replace(/米青丬士/g, '精壮').replace(/口申口今/g, '呻吟').replace(/月几月夫/g, '肌肤')
// 孚乚汁
.replace(/酉禾月匈/g, '酥胸').replace(/酉禾孚乚/g, '酥乳').replace(/孚乚/g, '乳')
// 冫夌辱
.replace(/冫夌/g, '凌')
// 忄青趣
.replace(/忄青/g, '情')
// 忄夬感
.replace(/忄夬/g, '快')
// 衤果体 衤果露
.replace(/衤果/g, '裸')

/**
* <code>
// https://www.piaotian.com/html/14/14229/9757030.html 修仙三百年突然发现是武侠 第一百二十五章 飞剑千里取人头
我渡法马上就要彻底蜕去这**凡胎,成就罗汉金身了!
// 肉眼凡胎
</code>
*/
.replace(/([^*])\*{2}凡胎/g, '$1肉体凡胎')

/**
* <code>
// https://www.ptwxz.com/html/6/6682/3851642.html 最仙遊 正文 第一百二十六章 强敌 (谢盟更之一)
其所说十有*为真。
</code>
*/
.replace(/十有\*{1,2}([^*])/g, '十有八九$1')

/**
* <code>
// https://www.piaotian.com/html/14/14229/9785496.html 修仙三百年突然发现是武侠 第一百四十八章 心魔蛊惑,恭请九火炎龙!
意味着这个猜测**不离十。
</code>
*/
.replace(/([^*])\*{2}不离十/g, '$1八九不离十');
text = CeL.work_crawler.fix_general_censorship(text);

// ----------------------------
// 去除廣告。
Expand Down Expand Up @@ -378,6 +302,7 @@ crawler = new CeL.work_crawler({
// https://www.ptwxz.com/html/13/13305/9960310.html
<br /><br />&nbsp;&nbsp;&nbsp;&nbsp;谷輥<br /><br />
// https://www.ptwxz.com/html/13/13305/9961817.html
<br /><br />&nbsp;&nbsp;&nbsp;&nbsp;谷婚<br /><br />
Expand All @@ -387,12 +312,27 @@ crawler = new CeL.work_crawler({
/**
* <code>
// https://www.piaotian.com/html/13/13793/9811250.html 我只想安静的做个苟道中人 第一百五十六章:何以证明?(第二更!求订阅!)
<br/><br/>&nbsp;&nbsp;&nbsp;&nbsp;谷  罡风呼啸间,所有气劲齐齐一聚,化作一只遮天蔽日的巨掌,显现虚空,咆哮着扑向裴凌。<br/><br/>
</code>
*/
.replace(/(&nbsp;)谷(  )/g, '$1$2')
/**
* <code>
// https://www.piaotian.com/html/14/14229/9733468.html 修仙三百年突然发现是武侠 第一百零九章 她叫姜七七
还能引动仙剑异象时更加震惊。谷<br/><br/>
// https://www.piaotian.com/html/13/13793/9750872.html 我只想安静的做个苟道中人 第七十章:陌生记忆。(第二更!求订阅!)
<br/><br/>&nbsp;&nbsp;&nbsp;&nbsp;萧家现在,应该没有丫鬟才对!谷<br/><br/>
// https://www.piaotian.com/html/13/13793/9756592.html 我只想安静的做个苟道中人 第七十二章:同样的方法。(第二更!求订阅!)
婢子……似乎听说过,但现在就是想不起来了。”谷<br/><br/>
</code>
*/
.replace(/()谷(<br\s*\/?>)/g, '$1$2')
.replace(/([。!”])谷(<br\s*\/?>)/g, '$1$2')
/**
* <code>
Expand Down Expand Up @@ -425,9 +365,19 @@ crawler = new CeL.work_crawler({
// https://www.piaotian.com/html/12/12964/9952296.html 顶级气运,悄悄修炼千年 第1022章 帝星之盛势
<br/><br/>&nbsp;&nbsp;&nbsp;&nbsp;强牺读牺。坐于首座的中年男子正是厉遥之子,韩云瑾。<br/><br/>
// https://www.piaotian.com/html/13/13793/9858834.html 我只想安静的做个苟道中人 第一百九十六章:阴影中的禁忌!(第一更!求订阅!)
制大制枭。
// https://www.qbtr.cc/tongren/6840/64.html 斗罗:转生海魂兽,比奇堡三大将 第64章
...制大 . 制枭</p><p>
// https://www.piaotian.com/html/14/14431/10248218.html 道诡异仙 第545章 交易
“洪兄,后会有期了。”制大 . 制枭这候 章汜<br/><br/>
// https://www.piaotian.com/html/13/13793/9858835.html 我只想安静的做个苟道中人 第一百九十七章:言说尊号。(第二更!求订阅!)
却都毫无用处。这候TI**X*章汜<br/><br/>
</code>
*/
.replace(/强牺\s*[a-z.]*\s*读牺。?/g, '')
.replace(/(?:强牺|制大|这候)\s*(?:[A-Za-z.*]*\s*)?(?:读牺|制枭|章汜)。?/g, '')

/**
* <code>
Expand Down Expand Up @@ -645,6 +595,20 @@ crawler = new CeL.work_crawler({
// 整行抽掉
, '')

/**
* <code>
// https://www.piaotian.com/html/13/13793/9846812.html 我只想安静的做个苟道中人 第一百八十七章:皇朝合道。(第一更!求订阅!)
<br/><br/>&nbsp;&nbsp;&nbsp;&nbsp;喜欢我只想安静的做个苟道中人请大家收藏:我只想安静的做个苟道中人更新速度最快。<br/><br/>
// https://www.piaotian.com/html/13/13793/9858834.html 我只想安静的做个苟道中人 第一百九十六章:阴影中的禁忌!(第一更!求订阅!)
<br/><br/>&nbsp;&nbsp;&nbsp;&nbsp;喜欢我只想安静的做个苟道中人请大家收藏:我只想安静的做个苟道中人笔下文学更新速度最快。<br/><br/>
</code>
*/
.replace(/(?:&nbsp;)+喜欢.{2,40}?请大家收藏:.{2,40}?更新速度最快。(?:<br\s*\/?>)+/g,
'')

/**
* <code>
Expand Down
2 changes: 1 addition & 1 deletion novel.cmn-Hans-CN/quanben.js
Original file line number Diff line number Diff line change
Expand Up @@ -176,7 +176,7 @@ var crawler = new CeL.work_crawler({
//
text = html.between('<div id="content">', '</div>');

text = text.replace(/(空|浩浩|坦坦)\*{2,}/g, '$1荡荡');
text = CeL.work_crawler.fix_general_censorship(text);

this.add_ebook_chapter(work_data, chapter_NO, {
title : chapter_data.part_title,
Expand Down
Loading

0 comments on commit 64073a7

Please sign in to comment.