Wikipedia:地区词处理:修订间差异
无编辑摘要 标签:2017年版源代码编辑 |
|||
第75行: | 第75行: | ||
=== 参考文献应避免情况 === |
=== 参考文献应避免情况 === |
||
此外,参考文献中的文字 |
此外,参考文献中的文字不应进行繁简转换(非中文的标题、姓名、引文等内容的中文翻譯除外)。因此,如果在参考文献中不进行避免繁简转换的处理,则无论是在全局转换、主题转换还是全文转换中,都有可能会对其中的文字造成影响。为避免此类现象发生,<u>请在引用参考文献时使用可防止繁简转换的{{tl|cite}}系列模板</u>。 |
||
=== 官方中文名稱處理 === |
=== 官方中文名稱處理 === |
2022年8月3日 (三) 15:07的版本
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
在中文维基百科裡,地區詞处理和繁简处理是字词转换系统的两大组成部分。地區詞转换旨在为中国大陆、香港、澳门、新加坡、马来西亚、台湾的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡(zh-sg)及马来西亚(zh-my)的地區詞为简体中文;台湾(zh-tw)、香港(zh-hk)与澳门(zh-mo)的地區詞为繁体(正體)中文。
修改歷程
- 港澳繁體:原以zh-hk參數涵蓋zh-mo,社群於2013年討論後,正式啟用zh-mo參數,拆分「香港繁體」和「澳門繁體」。
- 馬新簡體:原以zh-sg參數涵蓋zh-my,而在2018年經過社群討論後,正式啟用zh-my參數,拆分「新加坡簡體」和「大馬簡體」。
轉換涵蓋順序
- 中文:zh兼容zh-hans、zh-hant
- 簡體:zh-hans ⊃ zh-cn ⊃ zh-sg ⊃ zh-my
- 繁體:zh-hant ⊃ zh-tw ⊃ zh-hk ⊃ zh-mo
因此若順位較低的地區詞與上一順位者相同,擇該上位者涵蓋即可。zh雖兼容zh-hans、zh-hant直接取代,但下位區域轉換不影響。
全局转换
地区词的全局转换总共通过五个转换表来实现:分别是MediaWiki内置的转换表、大陆简体转换表、台湾正体转换表、港澳繁体转换表和新马简体转换表。
全局转换是最为方便快速的转换处理方式,但也较容易出现过度转换的问题。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词汇(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区转换。
对于地区词的全局转换,维基百科特别设立了一个字词转换/地区词候选的页面,在该页面中,用户可根据需求,并在符合后文中列出的先决条件的情况下,提交其希望加入全局转换的地區詞。并通过社群投票产生共识,再由管理员加入相应的转换页面中。
判断投票通过的一般依据是:在7天时间里,总共获得6名具备投票资格的维基人的支持,且反对票数不超过总票数的三分之一。
以下为提请加入全局地区词转换的先决条件(申请删除全局地区词转换没有这样的限制,提报位置见下):
- 被转换词为单字的转换绝不能出现在全局转换中,例如“宏=>巨集”的转换;
- 提请进行全局转换的被转换词必须至少在100篇条目中出现(可通过搜索引擎以判断);
此外,被转换词字数较少(不大于三字)的转换,社群在投票过程中还应考虑其中汉字的字频,以及可能导致过度转换的可能性。
关于汉字字频方面的研究,可参考汉字单字字频总表、现代汉语常用字表与其他的相关统计。
如果您发现了地区词的过度转换错误,请前往Wikipedia:字词全局转换修复请求提报。
全文转换
全文转换适用于特定的单个条目,有极强的针对性。
“-{A|转换内容}-”是全文转换的源代码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利于进行维护。因此,维基百科推荐内嵌全文转换的{{NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目源代码的顶端插入“{{NoteTA}}
”的模版,并依照该模版页面的说明输入转换内容即可。
由于全文转换的针对性极强,所以较难出现过度转换的情况。但有些情况也需要利用单独转换来实现。
公共组转换
对于一些主题、领域相同和相似的条目,其中需要被转换的内容是大同小异的,可以把這些多个条目中要用到的共同轉換字詞單獨建立一個公共轉換組。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。
建立一個公共轉換組時,要依據這一組大多數詞彙在多個條目中被轉換的可能性,而不應依據轉換詞彙的類別。比如,各國現任領導人的姓名轉換,存在複用的可能性非常低,就不應當建立這樣類別的公共組。建立公共轉換組的方法可參見Wikipedia:字詞轉換處理/公共轉換組中。
公共组转换中的转换内容可由普通用户所控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换。一个典型的例子是“數位=>数码”的转换:对于全局转换来说,在非电脑和信息技术相关的条目中,“數位”的后侧极有可能会搭配“人士”并组成“數位人士”一词,这样便会导致“数码人士”的过度转换结果产生。然而,在电脑和信息技术的公共组转换中,所涉及到的条目大多是技术类型的条目,其中有许多本来就应该被转换的“數位”词语,同时,技术性的内容也导致“數位人士”的用法几乎不会出现。
然而,也正如上述所说,假如真的碰巧出现了“數位人士”,公共组转换也有其局限。过度的地区转换可以通过繁简处理的全局转换来进行修复(详见该页面),也可以通过后文中提供的其他方式实现。
单独转换
“-{转换内容}-”或“避免过度-{}-转换内容”是单独转换的源代码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。
举例而言,在条目艾奥瓦州中,单独转换“又譯作'''-{zh:爱荷华州;zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''
”可以用于别名的展示。其展示的结果便是“又譯作爱荷华州、爱我华州或衣阿華州”。或者,使用「{{各地中文名}}」等模板,說明之間差異。
又举例说明避免特定的过度转换:上文所述的“數位人士”,在存在“數位=>数码”转换的同时可通过“數-{}-位人士”来避免过度转换。
注意事项
手动转换书写格式
- 概括而言:您可以只使用zh-hans与zh-hant便达到目的,也欢迎您按照推荐的格式来书写
虽然,地區詞处理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg、zh-my六种模式,但出于方便实际操作的原因,并不强制要求按照何种方式填写,只要填写的转换能够满足预期的要求,并在各种模式下都不出现错误即可。
然而,上述的操作实际上并不完全符合于繁简转换与地區詞转换分立的思想。因此,这里还推荐另一种做法,即让zh-hans、zh-hant的名称保持一致,只填寫繁简體對應詞,不要填寫對應地區詞。對A轉換采用哪一地區詞先到先得(即先編輯轉換的),對於T轉換,要求除繁簡之別外與標題一致。这一做法并不要求所有的编者都要掌握,因此不会对第一种简便做法填写造成任何妨碍,了解第二种做法的编者会逐渐地将第一种做法修正。
参考文献应避免情况
此外,参考文献中的文字不应进行繁简转换(非中文的标题、姓名、引文等内容的中文翻譯除外)。因此,如果在参考文献中不进行避免繁简转换的处理,则无论是在全局转换、主题转换还是全文转换中,都有可能会对其中的文字造成影响。为避免此类现象发生,请在引用参考文献时使用可防止繁简转换的{{cite}}系列模板。
官方中文名稱處理
當一個機構或人物已經有官方的漢字或中文名稱時,社群對應否進行地區詞轉換出現分歧。根據討論結果,临时解决方案為:条目名称遵从“名从主人”原则,使用条目描述事物(人、物、事件等)所在地的最常用用法(例如新马简体版本:马哈迪);但其他地区语言版本依然显示该地区的最常用用法(例如大陆简体版本:马哈蒂尔),在内文以“地区词转换”方式显示名称(注:此方案不反对在文中个别地方标明条目描述事物在其他地区的名称)。