User:Xiplus/繁简处理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
在中文维基百科裡,繁简处理和地区词处理是字词转换系统的两大组成部分。繁简转换旨在为用户提供只针对单字的转换(并包括繁简/简繁一对多的转换,例如簡體的「打斗」會正確地轉換成繁體的「打鬥」),是进一步实现地区词转换的基础。本页面提出一些进行繁简转换编辑维护的指引。
维基百科简体字与繁体字的转换,是指中华人民共和国所制定规范汉字与华语圈传统汉字之间的转换,转换范围基本以《通用规范汉字表》为准,但亦会根据民间习惯和实际需要作弹性调整。
全局转换
[编辑]维基百科的繁简转换总共通过三个转换表来实现:其一是MediaWiki内置的转换表ZhConversion.php,其二是在MediaWiki:Conversiontable/zh-hans中定义的简体中文转换表、其三是在MediaWiki:Conversiontable/zh-hant中定义的繁体中文转换表。
如果您遇到了以下三种情况,请前往Wikipedia:字词全局转换修复请求中提报,管理员会尽快进行处理,而无需通过手工转换来修复:
- 繁简/简繁一对多的转换出现错误。例:「乾隆」被过度转换成了「干隆」(由于“繁体:乾=>简体:乾、干”的一对多转换);
- 地区词的全局转换出现错误。例:“東加拿大”被过度转换成了“汤加拿大”(由于“臺灣正體:東加=>大陆简体:汤加”的地区词全局转换),“撒贝宁”被过度转换成了“撒貝南”(由于“大陆简体:贝宁=>臺灣正體:貝南”的地区词全局转换);
- 某一个单字没有被转换。例:“東”未被转换成“东”,但此种情况较为罕见。
注意事项
[编辑]条目标题
[编辑]用繁体或简体建立的页面,标题必须全部为简体或繁体字,如果标题繁简混杂,例如「中國历史」,那么系统将无法自动转换。如果您发现了这样的页面,请将它移动到简体标题或繁体标题,然后将重定向页面挂上{{d|R3}}标签。但,某些會被系統視作簡體字的傳承字、俗字(如「杰」、「灯」等)的特殊情況除外(是否為簡體字應視具體情況而定)。
如果有繁简体两个版本的文章,則必須进行合并。具体参见Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項。通常這樣的情況很少見,維基程式會自動在你建立條目時判斷有無對應繁簡的條目並做出處理,但通過移動等方式也會產生同一事物的繁簡兩個版本條目。
若某页面已存在繁体中文标题的页面,亦不得创建简体中文标题的相同内容的页面,反之亦然,如已存在名為哈萨克的条目,亦不能创建名為哈薩克的条目。
勿与地区词转换相混淆
[编辑]虽然繁简转换与地区词转换都使用相同的转换技术,但它们发挥的功能并不一样。因此,请不要将地区词的全局转换请求提交到Wikipedia:繁简体转换请求中。如需了解更多相关的内容,请参见Wikipedia:地区词处理。
勿替換条目繁简语句
[编辑]编辑维基百科条目的时候,如果缺乏正当理由,请不要手动地将条目源码中的繁体语句转为简体,或简体转为繁体(广义地也包括将一个地区用词替換成另一地区用词,如港澳繁体替換成臺灣正體),以免影响他人的编辑和阅读。手动做这种替換可能将被视为“繁简破坏”,见Wikipedia:破坏#破坏类型中的“繁简破坏”一条。
对于读者来说,想只看繁体或简体的读者,可以在界面上方选择“大陆简体”、“香港繁體”、“澳門繁體”、“大马简体”、“新加坡简体”與“臺灣正體”六者之一;
对于编辑者来说,想修正机器转换不正确的词汇,可以使用形如“-{zh-hans:一般简体词汇; zh-hant:一般繁體詞彙; zh-cn:大陆简体词汇; zh-tw:臺灣正體詞彙; zh-hk:香港繁體詞彙; zh-mo:澳門繁體詞彙; zh-my:大马简体词汇; zh-sg:新加坡简体词汇}-”这样的“手工转换”的技术,或者{{NoteTA}}模板。总之手动替換条目繁简语句是没有必要的。
请注意:若您的浏览器安装了同文堂等中文繁简转换软件,或可以进行中文繁简转换的移动應用程式,请在编辑时将其关闭或移除。
勿替換或手動轉換異體字
[编辑]儘管異體字間的功能相近,且所代表的意義相同,但手動替換異體字,很可能引發編輯爭議,甚至招致編輯戰的發生。因此在替換或手动转换异体字之前,请先考虑以下两种情况:
一是在现代汉语中或者电脑输入中已经不再使用或者极少使用的异体字,如「靑/青」、「敎/教」、「囯/国」,这种情况下,将异体字替換为正体字是值得提倡的,反之则视为破坏。因为此类异体字在电脑输入或者现代汉语中极少用到,使用此类异体字不便于阅读。
二是目前现代汉语中仍然有在使用的异体字,此类异体字由于使用频率较高,或者是在不同的地区,对哪一个字是正体的定义不一样,例如「床/牀」,中国大陆和台湾把「床」视为正体字,把「牀」视为异体字,而在香港则是相反,香港视「牀」为正体,对此类异体字进行替換或手动转换违反了避免地域中心方針。此外,「台/臺」这一对字由于政治原因常常成为修改的对象,由于「台」字虽为俗写,但是在台湾已经广泛使用,因此不应该对其进行替換,而是应该遵循先到先得的原则,因为对这些字进行替換对条目没有实际的改善作用。
概括性来讲:
- 如果所有地区皆常用A,罕用B→可将源码B直接改为A,不宜使用转换。
- 如果某些地区常用A而罕用B,某些地区常用B而罕用A→源码文字先到先得,不得修改,同时全局转换。
- 如果所有地区混用A/B→源码文字先到先得,不得修改,不得使用转换。
- 如果某些地区混用A/B,其他地区常用A而罕用B→源码文字先到先得,不得修改,其他地区可使用转换。
日本漢字
[编辑]因為日本漢字不屬於中文,所以日本漢字不应參與中文的繁簡轉換。但是,部分日本漢字與中文存在重疊,系統可能误将其认作中文而轉換。
这种情况下,您应当使用{{lang|ja|日本語漢字}}
來防止其被誤轉換。如果是因为其他原因而非日本汉字需要避免被进行简繁转换的,如在一些网站,简体和繁体的用户名是被当做两个不同的账号,这时可以用-{汉字漢字}-
或<nowiki>汉字漢字</nowiki>
来达到禁止转换的效果。在使用cite系列模板标记参考来源时,遇日文汉字可使用|script-title=ja:XXX
展示来源标题。(韩文汉字的情况同理,使用|script-title=ko:XXX
展示来源标题。)
外部連結
[编辑]- 《通用規範漢字表》(2013年08月19日发布,中国大陆用字规范)