维基百科:字词转换/修复请求
|
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
本页面为维基百科:字词转换下属子页面,用于处理各维基计划全域转换和中文维基百科本地全局转换中的所有繁简与地区词错误转换修复的请求。
轉換与修复原理
[编辑]由於简体中文、繁体中文之间存在一对多现象,即以單一简化字或繁体字來对应多個繁體字或简化字[1][2],因此必須有額外的数据來補足原先丟失的信息。例如,繁體中的“髮”或“發”,在简体下都是“发”。在程序裡,我們有一個默认的對應,比如說“發”。那麼一般情況下要從簡體轉換成繁體時,程序遇到“发”就會先將其轉換成“發”。那麼什麼時候對應成“髮”呢?這就要看詞庫而定。比如詞庫中有“头发=>頭髮”的關係,這樣“头发”就會被轉換成“頭髮”。如果沒有這一關聯,那“头发”就會被錯誤地轉換成“頭發”。
那詞庫是如何创建的呢?我們先有每個字的默认對應,比如“发”轉換成“發”。然後我們在一個現有的繁體詞庫中尋找包含繁體“發”的词,再轉換成简体。這樣得到一個從简体到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的默认對應關係。同样,修復過度轉換也是由上述的方法來處理。
外部連結
[编辑]错误转换修复请求
[编辑]繁简转换请求存档 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
错误修复请求存档 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
早於7日的討論將會由Jimmy-bot存檔。 |
峯
[编辑]
请修复简体模式下错误转换:「峯」,正确转换应为「峰」。出错页面:金峯山寺。其他說明:峯在《通用规范汉字表》作为峰的异体字,同羣和群。--Kethyga(留言) 2024年4月7日 (日) 09:56 (UTC)
- 異體字是相互的,不等同於繁體字。雖然有些異體關係中存在正體字,但是「峯」並不罕見於簡體中文環境的人名地名專名,不宜統統被「峰」取代。--— Gohan 2024年4月28日 (日) 07:49 (UTC)
- 简体中文环境常见“峯”?“峯”在《通用规范汉字表》中就是“峰”的异体字,繁体字和异体字在《中华人民共和国国家通用语言文字法》的地位是完全一致的,都是限定在一些场合使用(见第十七条),在中维的转换规则自然也应视同繁体字(既是规范汉字又作为另一个字异体字的情况除外,如“喆”“昇”等,但繁体字同有这种情况如“乾”,仍进一步说明它们地位是一致的)。既然异体字“棄”转换为了“弃”,“峯”当然也应转换,正式场合中国大陆也用“林峰”而不用“林峯”([1])。--自由雨日(留言) 2024年6月9日 (日) 16:06 (UTC)
- 维基的转换规则不会完全拘泥于《通用规范汉字表》规定,因为规定往往是滞后的,当前媒体与社会的用字倾向随时有可能突破(近年甚至出现了黄霄雲这样的极端人名用字,但目前只是孤例)。不过对于本案,仍可继续讨论。—Chiefwei(论 - 历) 2024年6月10日 (一) 03:08 (UTC)
- 感谢阁下提醒!您的回复给了我很大启发。不过……《通用规范汉字表》虽可能滞后,但却是强符合“可供查证”的(以及相对滞后也意味着相对稳定),根据媒体社会用字倾向来决定转换,是否会有原创研究/总结之嫌?比如黄霄云,在今年(2024年)文联旗下中国文艺网中的人名还是“云”而非“雲”([2]),在看不到当事人身份证的情况下,不同可靠来源中有不同用字,该如何定夺呢?--自由雨日(留言) 2024年6月10日 (一) 03:24 (UTC)
- 文联既不代表在可靠來源中常用,亦非黄霄雲的主人或本人。在簡體中文環境的主流媒體中,「黄霄云」並不比「黄霄雲」常用。--— Gohan 2024年6月29日 (六) 08:37 (UTC)
在简体中文环境的主流媒体中,“黄霄云”并不比“黄霄雲”常用。
[來源請求]--自由雨日(留言) 2024年6月29日 (六) 08:43 (UTC)
- 文联既不代表在可靠來源中常用,亦非黄霄雲的主人或本人。在簡體中文環境的主流媒體中,「黄霄云」並不比「黄霄雲」常用。--— Gohan 2024年6月29日 (六) 08:37 (UTC)
- 感谢阁下提醒!您的回复给了我很大启发。不过……《通用规范汉字表》虽可能滞后,但却是强符合“可供查证”的(以及相对滞后也意味着相对稳定),根据媒体社会用字倾向来决定转换,是否会有原创研究/总结之嫌?比如黄霄云,在今年(2024年)文联旗下中国文艺网中的人名还是“云”而非“雲”([2]),在看不到当事人身份证的情况下,不同可靠来源中有不同用字,该如何定夺呢?--自由雨日(留言) 2024年6月10日 (一) 03:24 (UTC)
- 請閣下留意簡體字在維基百科並非只有中國大陸使用——也會影響星馬用字,並區分「應然」與「實然」。維基百科的「應然」取決於現實的「實然」,而不由中國大陸的「應然」決定。另外,對於中國大陸,仍有不少人「名」中違法使用異體字,也曾鬧出不少交通站名借字改地名引發爭議、甚或最終改回異體字原名的新聞。--— Gohan 2024年6月13日 (四) 07:29 (UTC)
- 维基的转换规则不会完全拘泥于《通用规范汉字表》规定,因为规定往往是滞后的,当前媒体与社会的用字倾向随时有可能突破(近年甚至出现了黄霄雲这样的极端人名用字,但目前只是孤例)。不过对于本案,仍可继续讨论。—Chiefwei(论 - 历) 2024年6月10日 (一) 03:08 (UTC)
- 简体中文环境常见“峯”?“峯”在《通用规范汉字表》中就是“峰”的异体字,繁体字和异体字在《中华人民共和国国家通用语言文字法》的地位是完全一致的,都是限定在一些场合使用(见第十七条),在中维的转换规则自然也应视同繁体字(既是规范汉字又作为另一个字异体字的情况除外,如“喆”“昇”等,但繁体字同有这种情况如“乾”,仍进一步说明它们地位是一致的)。既然异体字“棄”转换为了“弃”,“峯”当然也应转换,正式场合中国大陆也用“林峰”而不用“林峯”([1])。--自由雨日(留言) 2024年6月9日 (日) 16:06 (UTC)
鳽
[编辑]
请修复大陆简体模式下错误转换:「鳽」,正确转换应为「𫛚」。出错页面:小葦鳽。其他說明:疑似在中日韓統一表意文字擴展區內的部分簡化字有數個並未被順利轉換成對應的繁體,並導致小苇𫛚及小葦鳽不被視作同等詞彙。另外可能一些同樣以鳥部類推簡化的字,如F區「𮭥」也有有類似情況。(但與𫛚字同區的「𫛭」就有成功轉換。)--WiTo🐤💬 2024年4月24日 (三) 08:37 (UTC)
- @T45614631:“𫛚”和“𮭥”属于通用规范汉字表以外的汉字(简称“表外字”)而“𫛭”属于表内字。表内字肯定是得到简化了的,但表外字是否需要类推简化具有争议性,因为中国政府态度模糊并未明言表外字需要或不需要简化(多数实际操作中类推简化了)。我不是要说上述两个字不可以简化,但可能需要更多讨论。可以看这里关于应不应该无限类推简化的一堆文章。另外我想到了植物也有一个“苦蘵”,当中的“蘵”要不要简化也可以讨论一下。--微肿头龙(留言) 2024年5月6日 (一) 09:58 (UTC)
- 好,我去客棧開個話題。--WiTo🐤💬 2024年5月6日 (一) 15:30 (UTC)
- 等待共识,暂不处理。—Chiefwei(论 - 历) 2024年6月9日 (日) 11:35 (UTC)
打印尼
[编辑]
请修复大陆简体模式下错误转换:「打印尼」,正确转换应为「列印尼」。出错页面:Viu。其他說明:“列印-打印”。常见组合“位列印尼”、“一列印尼”、“名列印尼”。举例,營多麵的“系列印尼”,印度尼西亞駐泰國大使館的“并列印尼”,桑迪亞加·烏諾的“名列印尼”。可能需要排除“列印尼龍”。--Kethyga(留言) 2024年8月12日 (一) 06:20 (UTC)
- 這個問題貌似在各個出問題的條目中直接用
-{}-
打斷比較好?--竹林下小徑,月光映一葉 2024年8月21日 (三) 03:48 (UTC)
马哈迪
[编辑]请修复臺灣正體、香港繁體模式下错误转换:「马哈迪」,正确转换应为「马哈迪」。出错页面:多個頁面。其他說明:如無使用{{noteTA}}模板,在繁體模式下會顯示「马哈迪」(即無論在任何模式下均顯示為大馬簡體模式。)--~Mahogany~(留言) 2024年8月13日 (二) 03:25 (UTC)
- 之前提报过,Wikipedia:字词转换/修复请求/存档/2024年8月,等待维基服务器更新。--Kethyga(留言) 2024年8月14日 (三) 01:12 (UTC)
- 服务器已更新。--屠麟傲血(留言) 2024年8月22日 (四) 15:00 (UTC)
吉他們
[编辑]
请修复所有簡體、台灣繁體模式下错误转换:「吉他們」,正确转换应为「結他們」。其他說明:建議是全轉換直接改成加入這個詞組就好,其他的可以考慮拿掉,因為維基百科可能還會有其他的「x結他們」這樣的描述,這樣做可以徹底修復這個詞的轉換錯誤,用google搜尋了一下,還是有一些:「site:zh.wikipedia.org "結他們"」--maki※有事請留言 2024年8月14日 (三) 12:25 (UTC)
餘力生
[编辑]
请修复繁體模式下错误转换:「餘力生」,正确转换应为「余力生」。出错页面:餘力生。其他說明:其個人印章作余(見 [3] 及 [4]),且餘姓遠比余姓罕見。--RcAlex36(留言) 2024年8月15日 (四) 11:17 (UTC)
野蠻告白
[编辑]请修复臺灣正體模式下错误转换:「野蠻告白」,正确转换应为「野蠻人」。出错页面:猩球崛起:王國誕生。--Bolsrb463(留言) 2024年8月16日 (五) 13:07 (UTC)
- 已修复--— Gohan 2024年8月20日 (二) 09:51 (UTC)
散無線電子
[编辑]
请修复繁體模式下错误转换:「散無線電子」,正确转换应为「散射电子」。出错页面:低能电子衍射、电子微探针、原子序数衬度像技术、扫描电子显微镜、电子束诱导沉积。其他說明:多个相关物理条目出现,简体的“散射电子”或“背散射电子”在繁体模式下触发“射电”—“無線電”机械转换,导致繁体模式下相关专有名词被转换成错误词语--Sufangxi(留言) 2024年8月18日 (日) 16:27 (UTC)
- 补充条目:埃弗哈特-索恩利探测器、電子能量損失譜。类似地还包括含有“透射电子”,“透射电子显微镜”,“衍射电子”等专有名词的条目--Sufangxi(留言) 2024年8月18日 (日) 16:41 (UTC)
麵臨
[编辑]
请修复繁體模式下错误转换:「麵臨」,正确转换应为「面臨」。出错页面:艾米琳·潘克斯特。其他說明:面字前面匹配到了“食面”(原文“允許對因絕食面臨健康不良的女權運動者進行釋放”),另外有阿卜杜勒-麥立克·本·麥爾萬的“哈里發麵臨”,丹那美拉的“窮人和麵臨處決的被告的捍衛者”,约阿希姆·冯·里宾特洛甫的“蒂索面臨著一個選擇”(Google搜索结果,现已随“索面”更正)等。--Kethyga(留言) 2024年8月20日 (二) 00:34 (UTC)
鬍子春
[编辑]
请修复繁體模式下错误转换:「鬍子春」,正确转换应为「胡子春」。出错页面:佛香閣。其他說明:姓氏作胡不作鬍。--RcAlex36(留言) 2024年8月23日 (五) 05:23 (UTC)