-
Notifications
You must be signed in to change notification settings - Fork 511
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
自动识别换行符 #530
Comments
+1,希望能优化空行的展示,目前将换行符替换成空格会导致翻译可读性变差,希望支持仅移除空行功能,比如:
仅移除空行后,效果变为和下述效果一致:
@ZoyDo @ripperhe |
貌似你俩说的不是一回事儿? |
我理解应该没有什么大的差别,都是针对可读性的问题讨论(目前替换换行成空格,全部挤在一堆了)。 我截图只是提了一个更具体解决方式。 |
好的,明白你意思了。 从你举例来看,你的重点应该是中间有空行,影响阅读,直接去掉空行即可,这个好实现的。 不过 @ZoyDo 侧重点可能是某种场景下,一句话分成了两段,用换行替换为空格的目的是想把这两段话合并为一句话,不然会影响翻译结果。这个就需要判断两段话本身到底是不是一句话,如果两段话是一句话,那就将换行替换为空格合并成一句话,如果不是,那就保持换行,这个需求我目前没啥好的思路。 |
是否是一句话,简单实现就是用英文标点符号作为断句而不是通过换行符,用换行替换空格通常不会对原语句有影响,目前看Bob呈现结果是符合预期的,并未出现影响翻译结果的情况 但空行在有的场景下的确会影响阅读,一些空行过多的情况会导致原文布局松散,需要通过滚动条下翻才能同步。 总之,还是希望可以考虑做“空行移除”优化,或者最好可以支持自定义正则匹配替换(在控制面板的文本处理部分,比如将 Eg.
|
「简单实现就是用英文标点符号作为断句而不是通过换行符」这个我感觉会有很多 bad case,不过后续可以实测体验,如果大部分场景下能适用,也可以作为一个选项提供。 「空行并未影响翻译结果」这个可以多测试几个翻译服务,确实可能会影响翻译结果的。 「换行替换空格并未影响翻译结果」恩,目前这个选项,在句子本来是一句,然后被拆成了多行的情况下,合并起来是符合预期的。但是如果本来不是一行的话,强行合并 ,可能结果就不符合预期了。我猜正是因为如此,@ZoyDo 才希望动态判断。 「希望可以考虑做“空行移除”优化」这个会考虑的。 |
OCR的时候能换行一下吗,要不然识别多行数据,直接就是一长串。 @ripperhe |
希望能够自动识别换行符,然后根据前后文判断是否需要将换行符替换为空格。
The text was updated successfully, but these errors were encountered: