维基百科:地区词处理

(重定向自Wikipedia:地區詞處理
字词转换
主页 讨论
轉換請求
错误修复请求
地区词候选
轉換介紹
字詞轉換處理 讨论
  繁简处理 讨论
  地区词处理 讨论
  公共轉換組 讨论
帮助文档
繁简与地区词处理 讨论
  转换原理 讨论
  手工轉換 讨论
  高级语法 讨论
  用字模式选择说明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 界面文字轉換
地区用词 地區詞模板
地区用词2 進階地區詞模板
各地中文名 地區用詞資訊框
查看 - 讨论 - 编辑 - 变动

地區詞处理繁简处理中文维基百科字词转换系统的两大部份,地區詞转换旨在为中国大陆、香港、澳门、台湾、新加坡、马来西亚的中文用户提供贴近其语言习惯的转换模式。中国大陆(zh-cn)、新加坡(zh-sg)及马来西亚(zh-my)的地區詞使用简体中文;台湾(zh-tw)、香港(zh-hk)及澳门(zh-mo)的地區詞使用繁體中文。

修改歷程

  • 港澳繁體:原以zh-hk參數涵蓋zh-mo,社群於2013年討論後,正式啟用zh-mo參數,拆分「香港繁體」和「澳門繁體」。
  • 馬新簡體:原以zh-sg參數涵蓋zh-my,而在2018年經過社群討論後,正式啟用zh-my參數,拆分「新加坡簡體」和「大馬簡體」。

轉換涵蓋順序

  • 中文:zh兼容zh-hans、zh-hant
  • 簡體:zh-hans zh-cn ⊃ zh-sg ⊃ zh-my
  • 繁體:zh-hant ⊃ zh-tw ⊃ zh-hk ⊃ zh-mo

因此若順位較低的地區詞與上一順位者相同,擇該上位者涵蓋即可。zh雖兼容zh-hans、zh-hant直接取代,但下位區域轉換不影響。

全局转换

地区词的全局转换通过MediaWiki内置转换表、數頁本地全局转换表实现。

全局转换是最方便快速的转换处理方式,但也较易过度转换。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区词转换。

用户可按需在Wikipedia:字词转换/地区词候选页提请希望全局转换表新增的地区词,所提的新詞應當符合以下新增全局轉換的先决条件

  1. 符合地區轉換詞基本資格;
  2. 提请需被全局转换的原詞绝不能只有1個漢字,以免過度轉換(如“宏→巨集”即不可)
  3. 提请全局转换的词至少在100篇条目中出现(可用搜尋引擎判断)

此外,對於字数较少(不多于三字)的需被转换(原)词,还应考虑其中汉字的字频,以免过度转换。(例如「内」字甚爲常用,「内存→記憶體」會引致「体内存在」轉換爲「體記憶體在」,故不應提請加入全局轉換)关于汉字字频方面的研究,关于汉字字频方面的研究,可参考汉字单字字频总表现代汉语常用字表其他相关统计

採納或拒絕全局转换地区词的新增請求取決於社群共识。若符合以上全部先決條件而無合理、屬實的異議(包括合理疑點均已消解),並且——

  • 不少於5人對此發言,請求提出已滿7天;或
  • 不少於3人對此發言,請求提出已滿30天;

則由管理員採納請求並納入相应转换表。但若在請求提出滿90天後發言人數仍不足3人,管理員可綜合已有合理、屬實的意見及己見,作出決定及處置;本句賦權的「決定」若為「拒絕」,須附上明確理由或指明所依據的意見。注,發言人數計入請求提出者、只作投票而不附理由的自動確認用戶;不計傀儡,不計只作投票而不附理由且非自動確認用戶者。

如有地区词过度转换错误,甚或需要删除全局转换地区词,请在Wikipedia:字词转换/修复请求提报。不過,如果此錯誤屬於罕有個案而只存在於您有權編輯的極個別零星頁面,您若通曉轉換語法,可自行予以適當修補。

全文转换

全文转换适用于特定的单篇条目,针对性极强。

“-{A|转换内容}-”是全文转换的源代码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利维护。因此,维基百科推荐内嵌全文转换的{{NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目源代码的顶端插入“{{NoteTA}}”的模版,并依照该模版页面的说明输入转换内容即可。

由于全文转换的针对性极强,所以较难出现过度转换。但有些情况也需要利用单独转换来实现。

公共组转换

对于一些主题、领域相同和相似的条目,其中要转换的内容大同小异,可以把這些多个条目中要用到的共同轉換字詞單獨建立一個公共轉換組。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。

建立一組公共轉換組時,要依據這一組大多數詞彙在多篇條目中轉換的可能性,而不應依據轉換詞的類別。比如,各國現任領導人的姓名轉換,存在複用的可能性非常低,就不應當建立這類別的公共組。建立公共轉換組的方法可參見Wikipedia:字詞轉換處理/公共轉換組

公共组转换中的转换内容可由普通用户控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换,典型的例子是“數位→数码”的转换:对于全局转换来说,與电脑和信息技术無关的条目中,“數位”后面可能会搭配“人士”组成“數位人士”一词,这样就会过度转换成“数码人士”。然而,在电脑和信息技术的公共组转换中,所涉及到的条目大多是技术类条目,其中有许多本来就应该转换的“數位”词语,同时,技术性的内容也导致“數位人士”的用法几乎不会出现。

然而,也正如上述所说,假如真的碰巧出现了“數位人士”,公共组转换也有其局限。过度的地区转换可以通过繁简处理的全局转换来修复(详见该页面),也可以通过后文中提供的其他方式实现。

单独转换

“-{转换内容}-”或“避免过度-{}-转换内容”是单独转换的源代码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。

举例而言,条目艾奥瓦州的单独转换:

又譯作'''-{zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-''''''爱我华州''''''衣阿華州'''

可以用于别名的展示。其展示的结果便是“又譯作爱荷华州爱我华州衣阿華州”。或者用「{{各地中文名}}」等模板,說明之間差異。

又举例说明避免特定的过度转换:上文所述的“數位人士”,在存在“數位→数码”转换的同时可通过“數-{}-位人士”来避免过度转换。

注意事项

手动转换书写格式

概括而言:您可以只使用zh-hans与zh-hant便达到目的,也欢迎您按照推荐的格式来书写

虽然,地區詞处理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg、zh-my六种模式,但出于方便实际操作的原因,并不强制要求按照何种方式填写,只要填写的转换能够满足预期的要求,并在各种模式下都不出现错误即可。

然而,上述的操作实际上并不完全符合于繁简转换与地區詞转换分立的思想。因此,这里还推荐另一种做法,即让zh-hans、zh-hant的名称保持一致,只填寫繁简體對應詞,不要填寫對應地區詞。對A轉換采用哪一地區詞先到先得(即先編輯轉換的),對於T轉換,要求除繁簡之別外與標題一致。这一做法并不要求所有的编者都要掌握,因此不会对第一种简便做法填写造成任何妨碍,了解第二种做法的编者会逐渐地将第一种做法修正。

参考文献应避免情况

此外,参考文献中的标题、章节等部分文字不应转换繁简(其他部分除外,尤其是外文作者姓名中譯等内容应参与转换),因此,如果不在参考文献的部分文字处停用繁简转换,则无论是在全局转换、主题转换还是全文转换中,都有可能会影响當中文字。为避免此类现象发生,建议在引用参考文献时使用可停用标题、章节等参数繁简转换的{{cite}}系列模板

官方中文名稱處理

當一個機構、組織、公司或人物已有官方的漢字或中文名時,社群對應否轉換地區詞出現分歧。临时解决方案為:条目標題遵从包括“名从主人”慣例在内的命名常規命名;各地中文變體版本對此以“地区词转换”方式显示當地可靠來源的最常用用法。此方案不反对在文中个别地方标明条目所述機構、組織、公司或人物在其他地区的名称。