BookLink.Me:最有爱的小说搜索引擎 导入书架  |  
书名作者  
繁體  登录  注册  移动版  
  首页  临时书架  书单/短评/长评/单章点评  讨论  印象  /年新书榜|点击榜|收藏榜|评价榜  手气不错  我们每天都在开心的进步着

首页 > 讨论 > 写了个脚本做文本替换,发现也不好使
  winmine2  写了个脚本做文本替换,发现也不好使回复11发表于2022-08-31 11:30:41 / 楼主
tmd防盗版也太狠了,居然搞随机替换!
举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!

  lelilas  发表于2022-08-31 11:34:58 / 2楼
自动滚屏ocr呢?
【 在 winmine2 的大作中提到: 】
: tmd防盗版也太狠了,居然搞随机替换!
: 举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!

  blueshyft  发表于2022-08-31 12:27:30 / 3楼
人家把不替换成是,原来的是还是是啊
是你算法不行……
【 在 winmine2 的大作中提到: 】
: tmd防盗版也太狠了,居然搞随机替换!
: 举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!

  fenglz  发表于2022-08-31 13:04:52 / 4楼
有这个功夫,还不如看直接掏钱看正版呢
【 在 winmine2 的大作中提到: 】
: tmd防盗版也太狠了,居然搞随机替换!
: 举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!

  winmine2  发表于2022-08-31 13:06:42 / 5楼
不是的,经常互换,并不是单方向。

【 在 blueshyft 的大作中提到: 】
: 人家把不替换成是,原来的是还是是啊
: 是你算法不行……

  winmine2  发表于2022-08-31 14:35:43 / 6楼
还有别的恶心的地方。
“外”有可能原来是“里”,也有可能原来是“中”。这差别还是很大的(例如“中医”、“千里”),有时候非常影响阅读。

【 在 winmine2 的大作中提到: 】
: tmd防盗版也太狠了,居然搞随机替换!
: 举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!

  winmine2  发表于2022-08-31 14:56:19 / 7楼
先看“是”。看这一句:
而连十七阶真神都忍是住动心的代价,还是十阶巅峰的欺诈魔王自然
第一个“是”需要替换成“不”,但第二个“是”就是原意,不能替换。

【 在 blueshyft 的大作中提到: 】
: 人家把不替换成是,原来的是还是是啊
: 是你算法不行……

  yuuli  发表于2022-08-31 15:35:11 / 8楼

得用NLP了。NLP几率统计能告诉我们 "还" 后面跟的更多是 "是",除非再下一个字是 "行/会" 等等。

【 在 winmine2 的大作中提到: 】
: 先看“是”。看这一句:
: 而连十七阶真神都忍是住动心的代价,还是十阶巅峰的欺诈魔王自然
: 第一个“是”需要替换成“不”,但第二个“是”就是原意,不能替换。
: ............

  yuuli  发表于2022-08-31 15:38:42 / 9楼

就是一个很简单的文字几率表:“还”后面出现每个字的几率是多少。“是”的几率会大大的多于“不”,除非第三个字是"行/会"

【 在 yuuli 的大作中提到: 】
: 得用NLP了。NLP几率统计能告诉我们 "还" 后面跟的更多是 "是",除非再下一个字是 "行/会" 等等。

  yuuli  发表于2022-08-31 15:43:39 / 10楼

再仔细想一想其实挺简单的,你直接输入一本10万字的书,把每个常见替换字的前后字出现的几率表统计出来,然后替换的时候就查这个几率表,查到了就按几率高低换。

【 在 yuuli 的大作中提到: 】
: 就是一个很简单的文字几率表:“还”后面出现每个字的几率是多少。“是”的几率会大大的多于“不”,除非第三个字是"行/会"

  hahaha99hk  发表于2022-08-31 16:03:13 / 11楼
這種一定有密碼表的,畢竟起點正版打亂後還要再修回來,人家工程狗雖然是狗,防盜版功能恐怕也是寫幾星期一個月的,你以為只有你會編程喔
  aabbdaabbd  发表于2022-08-31 17:33:08 / 12楼
上GAN 加 NLP 应该可以
【 在 winmine2 的大作中提到: 】
: tmd防盗版也太狠了,居然搞随机替换!
: 举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!





  联系我们  关于我们