中国特許情報の異表記・誤訳 用語編(その4)

2021年5月17日
アジア特許情報研究会:伊藤徹男

1.はじめに

ここでは既に紹介した誤訳の問題ではなく、どちらかというと異表記として検索式にも反映させるべき中国語「文字化け文字」と「異体字」を紹介します。

1)文字化け文字

「文字化け文字」とは、文字コードが異なるために日本で使われている通常のPCでは(Google Chrome やIEなどブラウザの問題でもなく)表示されない文字のことを指します。文字化け文字は台湾特許に多く見られますが、中国大陸特許にも存在します。
英語情報から洩れる「文字化け文字」も極めて少ないので、調査という観点からは無視してもよいものです。したがって、このような現象もある、という情報として受け止めていただければ結構です。

2015年までにかなり多くの化合物の文字化け文字を抽出して検索式に異表記として用いていました。1つの化合物に8種もの文字化け文字がある化合物なども存在していました。この文字化け文字も2015年の台湾特許庁訪問時に改善を要望しましたが、これについては「改善する予定はない」とのことでしたが、昨年(2020年8月)確認したところでは、抽出した文字化け文字では検索できないものも現れ、逆に困惑しています。用語辞書の修正が必要だと思っていましたが、修正に取り掛かれずにいました。一部の文字化け文字を多く含む用語(多くは化合物)について検証した結果を改めて紹介します。

2)異体字

異体字というのも聞きなれない用語ですがWebには以下のようにも紹介されています。
『異体字(variant)とは、文字としては異なる見た目を持つものの、 意味や発音が同じであり、歴史的・文化的な背景などから、ある文化圏や言語圏では同一の文字として見なされる文字のことを指します。
例えば「国」と「國」、「沢」と「澤」は、日本では新字と旧字として区別されるなど、 意味的には同じであっても一般的には異なる文字として扱われています。
日本では明らかに意味が違う文字なのに、 他の国では異体字と見なされ同一視される例もあります。 例えば「機」と「机」、「葉」と「叶」などは、 中国語圏では片方はもう片方の異体字として扱われます。 「千葉」と「千叶」が同一視されるとは日本語の感覚では想像しづらく、 「機上」と「机上」に至っては、日本語では意味が異なります。 しかし、中国語圏ではこれらは同じ意味・文字となります。』
https://www.nic.ad.jp/ja/basics/terms/variant.html

様々な漢字異体字を紹介した情報も存在します。
異体字 一覧」(https://www.google.com/search?lr=&as_qdr=all&sxsrf=ALeKk01hUqhj7FhgKhCU6Uz2ZrZi4IOcOg:1621243990336&source=univ&tbm=isch&q=%E7%95%B0%E4%BD%93%E5%AD%97+%E4%B8%80%E8%A6%A7&hl=ja&sa=X&ved=2ahUKEwiuiY3BtNDwAhVPxIsBHbW1AFMQjJkEegQIDxAB)

日本でも戦前の旧字体と戦後の新字体が異体字だとされていますが、ここで紹介する異体字は、上記のようなものではなく、特許情報中に存在する「よく目を凝らしてみても同じように見える表記の中国語」という、さらに特殊な文字です。「歴史的には昔使われたもの」とも定義されています。

2.文字化け文字

化合物としてはN原子やP原子を含むものに文字化け文字が多いのでその数例を例示します。

a)NITRILE

もっとも単純な化合物の例として「DINITRILE」の台湾特許を挙げます。DINITRILEは「二腈」と表記されますが、「二」と「二」もありますので、「二腈 or二 or二」を異表記として検索します。ACETONITRILEの場合も「乙腈 or 乙 or 乙」となります。 (注:文字化け箇所は□と表示される場合もあります。以下、同様。)
また、不飽和 (unsaturated nitrile)、丙烯 (acrylonitrile)、芳族 (aromatic nitriles)などと半角スペース部分がnitrileと英訳されているので、その部分をコピペして(*nitrile* and ( ))@tiと検索しましたが、nitrileとしては何も検索できませんでした。

b)OXAZOLE

上に示すように環形化合物にN原子やO原子などが挿入されたOXAZOLEなどの複素環化合物にも多く見られます(図1)。

図1.OXAZOLEの文字化け文字(CN公開特許)

(OXAZOLE or OXAZOL)と英語で検索すると、台湾特許では「噁唑, 惡唑, 㗁唑, 唑」と1種の文字化け文字を含んだ異表記を挙げることができますが、中国大陸特許では「噁唑, 恶唑, 吲唑, 唑, 唑, ∴唑,  �唑,  *唑 or 唑化合物 or 菌唑」と5種の文字化け文字が存在します。
中国大陸特許の1990-2020発行公開特許中には、最初の「唑」では「TI:87件、AB:46件、CL:0件」、2つ目の「唑」では「TI:61件、AB:79件、CL:3件(公告のみ)」と異なる表記のものです。いずれもOXAZOLEや唑烷(oxazolidine)を抽出します。

いずれも「唑化合物(OXAZOLE COMPOUND), 唑樹脂(OXAZOLE RESIN)」などと「唑」一文字が(この場合にはOXAZOLE)を表すことも多いですが、「唑」は咪唑(IMIDAZOLE)、吡唑(PYRAZOLE)などその他の複素環化合物にも使われているのでやっかいです。

c)PIPERAZINE

シクロヘキサンの向かい合わせになった2つのメチレン基をNHで置換した左のような構造の化合物です。中国語では「哌嗪」と表記されますが、これにも文字化け文字が存在します。

台湾特許では、「哌嗪」の他、「哌 or 派 or 嗪 or 六氫吡 or 六氫吡 or  or 」の7種の文字化け文字があります。

d)その他

いくつかの化合物については、2015年以前には存在した文字化け文字が解消されているものもあります。
QUINOLINEの台湾特許では、「喹啉 or 喏啉 or 喏 or 碄 or 林 or  or  or  or  or 」と8種の文字化け文字を含む異表記を辞書登録していましたが、2021年5月時点では「喹啉 or 喹林 or 喹碄 or 蒽啉 or 喏啉」(一部誤字と思われる中国語もありますが)と文字化け文字はなくなっています。上記、文字化け文字では検索できなくなっています。
QUINONEの「醌 or  or  or 菎 or  or  or 」の7種の文字化け文字、ONIUMの「鎓 or 」、NAPHTHALENEの「萘 or 奈 or  or 」の2種の文字化け文字などはなくなりました。

他方、INDOLEでは「吲哚 or  or  or  or 」の文字化け文字では検索できなくなりましたが、「吲哚 or 吲 or 吲 or 吲 or 吲」のように変更になっています。OXIME「肟 or 」、FURAN「呋喃 or 呋暔 or  喃」なども文字化け文字での検索が必要ですので、該当化合物の検索前の異表記取集作業でその都度、確認するといいでしょう。

また、台湾特許庁データベースGPSSでは、(*oxazol*)@tiや(*quinolin*)@tiとして、後方一致検索や部分一致検索でbenzoxazole(苯并唑)、isoxazolidine(异唑)などの中国大陸特許やALKYLPIPERAZINE(烷基哌)、ANILINOPIPERAZINE(苯胺)などの台湾特許も英語で検索が可能ですが、後方一致検索や部分一致検索ができないデータベースでは、やむなく文字化け文字での検索も動員せざるを得ません。

3.漢字の異体字

よく目を凝らしてみても同じように見える表記の中国語があります。これも「異体字」というらしい。この異体字は文字コードが違うために検索では差別されて抽出されますが、中国大陸特許だけでなく、2015年以前は台湾特許にも存在しました。2015年の台湾特許庁への要望で(簡体字で繁体字も検索できるように、という)台湾特許にも存在する異体字は正規表記の中国語(繁体字でも簡体字でも)で検索するとその区別はなくなり、解消されました。

しかし、CNIPRなどの中国特許データベースでの大陸特許検索では、現在でもなお、正規表記中国語と異体字は区別されて抽出されるので注意が必要です。異体字の存在数は極めてわずかなので無視してもいいかとは思いますが、権利判断調査では検索式に異体字も追加する必要があります。
また、このような(よく目を凝らしてみても同じように見える表記の中国語)異体字の存在はほとんど知られていませんので異体字で出願すれば検索から逃れることができる、とも言えます。見た目の公報表記は変わりませんので権利行使上も問題ないものと思われます。かつては日本特許でも意識的に検索逃れをしたのではないかというような例をセミナーで紹介したことがあります。

どんな文字が異体字として使われているか網羅した訳ではありませんが、以下のような例を挙げることができます。CNIPR 1990~2020年公開特許の出現数。

表1.中国語異体字の出現数

表1の異体字「硏究」については、発明の名称~請求の範囲では確認できませんが、出願人名では正規表記「究院」で333953件、異体字「究院」では53件を確認できます。
また、benzylの正規表記「苄」と異体字「芐」以外に似たような中国語として「卞」がbenzylと英訳されており、異体字かどうか不明ですが、請求の範囲で1060件存在します(卞胺(benzylamine)として132件)。権利侵害調査ではこれも異表記として検索式に加えています。
公報やディスプレイ上では判別できず、検索してはじめて確認できる、というのは困ったものです。調査対象範囲の他の用語についても早急に確認してみたいと思います。

4.中国語のスペルミス(誤記)

中国語が英訳されたもので特にスペルの長い英語には必ずと言っていいほどスペルミスが存在することについては、これまで何度か紹介しましたが、中国語にもスペルミスと思われる誤記があります。
「請求の範囲」を翻訳した英語情報は権利範囲を示したものですが、権利を確定する「請求の範囲」そのものではないので権利解釈上は問題になりません。中国語の誤記など誤記と判断されない場合、あるいは出願人などからの英語情報を元に中国語に翻訳された出願書類の誤訳が元で要求する権利内容とは異なる内容のものとなって無効審判などが起こされたりすることがあります。

ここでは異体字ではないそのような誤記について紹介したいと思います。数からすれば圧倒的に異体字より多いです。
中国特許における中国語のスペルミスについては、INFOPRO 2014で「タイプミスを含む中国公報に関する留意点」として渋谷氏が中国特許情報中の中国語表記について示唆に富んだ報告をしています。
予稿:http://patentsearch.punyu.jp/asia/INFOPRO2014type_miss_pre.pdf
発表資料:http://patentsearch.punyu.jp/asia/INFOPRO2014type_miss.pdf

そこでは、己烷(hexane)の己が(化学分野では六を示すhexaとして使われる)、「已烷」「巳烷」と誤記されたものが存在し、それぞれhexaneと英訳されており、中でも「巳烷」の誤記が多く、さらには「环巳烷」が「ring alkane」と誤訳されている公報も散見され、これは巳が無視されて「环烷」として英訳されたと考えられる、と考察しています。己烷に対する巳烷は概念の異なる用語に翻訳されたのもではないと思われるので、誤訳ではなく誤記として扱います。

このように「よく目を凝らしてみても同じように見える」異体字とは違って、「見た目が似た漢字(中国語)」が同一の英訳として表記されるものがいくつかあります。過去にも挙げました熱触媒としてのazobisisobutyronitrile (AIBN)がその1つです。英語のスペルも長いので英語スペルミスもかなり多いのですが、中国語について2000-2018年の公開特許における出現数を表2のように示し、それぞれの誤記についても注釈しています。

表2.azobisisobutyronitrile (AIBN)の中国語誤記

そしてさらにAIBNの「nitrile」としての出現数を表3のように示しています。

表3.Nitrileに該当する中国語の存在数

しかし、その後の検証で、表2中の「⑤⑥「睛」「晴」は「腈(nitrile)」の誤記と思われる。」については、以下のように誤記ではなく使われている例もありますので、訂正したいと思います。


丙腈(propanenitrile)
己二腈(adiponitrile)
氰(主としてcyanoとして)
氢氰(hydrocyanation)
还原氰基(reduce cyano groups)
氰基苯并(cyanobenzo)
氰酸酯(cyanate ester)

乙睛(acetonitrile)
丁睛(acrylonitrile)
丙烯睛(acrylonitrile)
丙二睛(malononitrile)

丁晴(nitrile butadiene) 同じ要約中に丁腈もあり
丙烯晴(acrylonitrile)
丁晴橡胶(nitrile rubber or nitrile butadiene rubber)
同じ要約中に丙烯腈(acrylonitrile)もあり。

その他、Polyethylene terephthalate(PET)の中国語誤記については、「中国特許情報の異表記・誤訳 用語編(その1)」で中国語の異表記としても紹介していますので割愛しますが、以下のような中国語の誤記例が数多くあります。ここでは一例を挙げます。
「中国特許情報の異表記・誤訳 用語編(その3)」では誤訳として紹介した羟(hydroxy)と羧(carboxy)の問題も中国語表記が似ているが故だと言えます。

・吡啶(pyridine)と呲啶
中国語「吡啶」はpyridineと英訳されますが、見た目にも同じような「呲啶」がPyridineと英訳されている例があります。pyridinoneも「吡啶酮」が一般的で「呲啶酮」はほとんど使われませんし、pyrazolylも「吡唑基」が使われ、「呲唑基」は極めてわずかです。しかし、中国大陸特許や台湾特許いずれでも両方が使われています。異体字ではなく文字が酷似している、という問題です。

文字化け文字や異体字などは極めてわずかなので無視してもいいと思いますが、中国大陸特許では英語のスペルミス、誤訳だけでなく、中国語のスペルミス(誤記)なども存在するので要注意です。特に、他社特許のウォッチだけでなく、自社の出願特許が権利行使できる内容になっているかも見直してみるのも重要です。

以上