- 写了个脚本做文本替换,发现也不好使
tmd防盗版也太狠了,居然搞随机替换!
举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!
自动滚屏ocr呢?
【 在 winmine2 的大作中提到: 】
: tmd防盗版也太狠了,居然搞随机替换!
: 举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!
人家把不替换成是,原来的是还是是啊
是你算法不行……
【 在 winmine2 的大作中提到: 】
: tmd防盗版也太狠了,居然搞随机替换!
: 举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!
有这个功夫,还不如看直接掏钱看正版呢
【 在 winmine2 的大作中提到: 】
: tmd防盗版也太狠了,居然搞随机替换!
: 举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!
不是的,经常互换,并不是单方向。
【 在 blueshyft 的大作中提到: 】
: 人家把不替换成是,原来的是还是是啊
: 是你算法不行……
还有别的恶心的地方。
“外”有可能原来是“里”,也有可能原来是“中”。这差别还是很大的(例如“中医”、“千里”),有时候非常影响阅读。
【 在 winmine2 的大作中提到: 】
: tmd防盗版也太狠了,居然搞随机替换!
: 举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!
先看“是”。看这一句:
而连十七阶真神都忍是住动心的代价,还是十阶巅峰的欺诈魔王自然
第一个“是”需要替换成“不”,但第二个“是”就是原意,不能替换。
【 在 blueshyft 的大作中提到: 】
: 人家把不替换成是,原来的是还是是啊
: 是你算法不行……
得用NLP了。NLP几率统计能告诉我们 "还" 后面跟的更多是 "是",除非再下一个字是 "行/会" 等等。
【 在 winmine2 的大作中提到: 】
: 先看“是”。看这一句:
: 而连十七阶真神都忍是住动心的代价,还是十阶巅峰的欺诈魔王自然
: 第一个“是”需要替换成“不”,但第二个“是”就是原意,不能替换。
: ............
就是一个很简单的文字几率表:“还”后面出现每个字的几率是多少。“是”的几率会大大的多于“不”,除非第三个字是"行/会"
【 在 yuuli 的大作中提到: 】
: 得用NLP了。NLP几率统计能告诉我们 "还" 后面跟的更多是 "是",除非再下一个字是 "行/会" 等等。
再仔细想一想其实挺简单的,你直接输入一本10万字的书,把每个常见替换字的前后字出现的几率表统计出来,然后替换的时候就查这个几率表,查到了就按几率高低换。
【 在 yuuli 的大作中提到: 】
: 就是一个很简单的文字几率表:“还”后面出现每个字的几率是多少。“是”的几率会大大的多于“不”,除非第三个字是"行/会"
這種一定有密碼表的,畢竟起點正版打亂後還要再修回來,人家工程狗雖然是狗,防盜版功能恐怕也是寫幾星期一個月的,你以為只有你會編程喔
上GAN 加 NLP 应该可以
【 在 winmine2 的大作中提到: 】
: tmd防盗版也太狠了,居然搞随机替换!
: 举个例子,“是”和“不”,并不总是颠倒的,大概三分之一的时候又是正确的!这时候脚本处理以后,反而就错了!