中国・台湾特許の異表記、誤訳

2020/8/15
アジア特許情報研究会:伊藤徹男

1.はじめに

基本的に日本語以外の外国語の読み書きができない私が外国特許調査をするのに頼りにしているツールは各国知財庁の原語データベースと「Google翻訳ツール」です。最近の翻訳ツールは日英翻訳だけでなく、中国語やハングルはもちろん、ベトナム語、タイ語、インドネシア語など多言語を翻訳するツールが各種現れ、AI翻訳を謳うツールまで出現しています。

各種の多言語翻訳ツールも触ってみましたが、翻訳精度の点ではやはり「Google翻訳ツール」が使いやすいと多用しています。英語のスペルをうろ覚えの時にもすぐさまアクセスすることも多いです。もちろん思うような翻訳結果を返してくれない場合もありますが。

無料の特許データベースではお気に入りのPATENTSCOPEにも多言語を翻訳してくれる「Cross Lingal Expansion」という機能があり、テクニカルタームなどを入力して検索すると各国原語に自動的に翻訳されて検索結果を瞬時に出してくれる機能があります。これも検証してみましたが、現状ではこれを使う気にはなれません。

Google翻訳ツール」も英語から中国語やハングルに翻訳してみると以前とは比べ物にならない翻訳精度に向上しています(図1)。不良な翻訳はユーザーからの投稿にもよって日々更新されていますので同じ用語を入れたのに先週とは翻訳結果が違う、というようなこともあります。しかし、他の翻訳ツールはもちろん、「Google翻訳ツール」でも特許調査に使うテクニカルタームなどの異表記までを拾ってくれる訳ではありません。以前は多少の異表記を抽出することができた機能もどこかに消えてしまいましたが、これとて異表記を網羅してくれるものではありませんでした(図2)。

英中翻訳例

図1.Google翻訳ツールの英語⇒中国語翻訳例

英中翻訳例2

図2.以前は若干の異表記も示してくれたが・・。

英語から中国語への翻訳ツールで、ある程度の異表記を拾ってくれるツールがあります。1つは、郑州(ていしゅう)大学が運営している「英汉-汉英科技大词典(英漢-漢英科学大辞典)」です(http://www3.zzu.edu.cn/zzjdict/ 図3)。英語から中国語を抽出するには使えますが、中国語から英語への翻訳は不良であることが多い。

laminateの翻訳例を示しましたが(図4)中国語の異表記だけでなく、laminateの様々な英語用法まで示してくれ、他の用語の中国語も確認できて参考になります。

鄭州大学辞典

図3.郑州大学英汉-汉英科技大词典

英中翻訳laminateの例

図4.英中翻訳laminateの例

もう1つは、「ChemYQ」(http://www.chemyq.com/xz.htm 図5)という英中の化学用語辞書です。郑州大学の「英汉-汉英科技大词典」は科学分野の技術用語をカバーしているとはいえ、化学用語となると難しいことが多いです。ChemYQでは他の翻訳辞書では翻訳できないような化学用語を、やはり異なる英語表現で中国語を拾ってくれるので参考になります。

chemYQ

図5.ChemYQ

上記2つの英中翻訳ツールでも、やはり特許調査用の異表記を網羅する訳にはいきません。

2.異表記を網羅して収集するには

原語異表記を網羅的に収集するには、英語情報を含んだ原語データベースから英語用語を基に原語情報を拾います。「検証Global Patent Search(GPS)データベース」の最後にも紹介しましたように、次のような手順で拾っていきます。3D printerの例で紹介します。

3D printerの英語異表記には単なる語尾変化もあります。それらはトランケーションを付けて「3D print*」として検索すると、「3D printer」の他、「3D print」「3D printing」「3D printable」「「3D printed」などが拾えることは周知です。そこでこの「3D print*」でまず前回紹介した無料の台湾特許データベースGPS(Global Patent Search)を使って中国特許の簡体字を拾ってみましょう。

GPSで抽出する特許を中国特許に限定するには「検索及顯示設定」で「大陸公開」「大陸公告」に設定します。台湾も含める場合には「本國公開」「本國公告」に設定します。限定しないとWoldwideな国が対象になりますので煩わしいと感じられることもあります。また、「発明の名称」から英語と中国語を対比して抽出するのが簡便なので申請日、申請號、專利名稱、IPCぐらいを結果一覧として確認できるようにしておき、1頁の表示件数も50件とした方が作業しやすいでしょう。

(1)「(3D print*)@ti」と期間限定もなく、ざっくり検索すると大陸公開だけでも110000件以上が抽出され、最初のページの50件だけでも「3D列印、3D列印、三維列印、3D列表、3D印表、3D印刷、3D打印、積層列印」などの簡体字が拾えます。
そのままページを繰って重複しない用語を見つけることもできますが、何度も同じ用語に遭遇するのは効率が悪いので見つけた用語だけでもnot演算して除きます。

(2)((3D print*) not (3D列印 or 3D列印 or 三維列印 or 3D列表 or 3D印表 or 3D印刷 or 3D打印 or 積層列印))@ti
すると一気に大陸公開だけで162件となりました。

三维(3D)打印、三维(3D)打印など括弧のついたもの、三维层积打印など3Dとprinterの間に用語が入ったものなどもあるのでこれらを拾うために「三维[1,5]打印」と近接演算子を使います。GPSを含む台湾特許データベースの近接演算子[1,5]はCNIPRでは「pre/4」に該当します。

このようなものも加えてnot演算し、0件になるまでやれば異表記を網羅できることになります。但し、英語でも「three-dimensional printing」や3DPと略称されたもの、技術分野的には「additive manufacturing(積層造型)」や「Fused deposition modeling (FDM) printed(溶融堆積)」などもその範疇になりますのでこれらの中国語も同様にして抽出すると以下のようになります。

(三维[1,5]打印 or 三维[1,5]列印 or 三维[1,5]印刷 or 三维印花 or 三维印相 or 三维印录 or 三维造型 or 三维造形 or 立体[1,5]打印 or 立体列印 or 立体印刷 or 立体成形 or 立体印花 or 立体印相 or 立体晒印 or 立体造型 or 立体造形 or 3D[1,5]打印 or 3‑D打印 or 3D打印 or 3D打印 or 3D打印 or 三D打印 or 3D列印 or 3D印刷 or 3D印花 or 3D印表 or 3D转印 or 3D造型 or 3D print* or three dimension* print* or 3DP or 积层打印 or 积层造型 or 积层制造 or 增材制造 or 层叠造型 or additiv* manufactur* or laminat* shap* or 熔融沉积 or 熔丝沉积 or 热融堆积 or 熔积成型 or 融积成形 or FDM打印 or FDM成型 or fus* deposit* model* or fus* deposit* mold*)

近接演算の幅をどこまで広げるか、three-dimensional lamination(三维叠层, 三维层叠, 三维积层, 三维堆叠)、lamination moldingなどの用語はどうか、また、「积层制造」などはノイズも拾うのでIPC(B29C64, B29C67, B33Yなど)で絞るべきか悩ましいものがあります。当然、用語だけで調査することはありえないので、IPCや用途、材料その他の用語をかけ合わせることになります。権利侵害調査などではIPC(B29C64, B29C67, B33Y)をor演算してその集合から探すことも必要となります。

台湾も同様にして繁体字を抽出すると以下のようになります。

(三維[1,5]打印 or 三維[1,5]列印 or 三維[1,5]列表 or 三維印表 or 三維印刷 or 三維積層 or 三維[1,5]成型 or 三維[1,5]造型 or 三次元造形 or 三維噴印 or 立體打印 or 立體印表 or 立體印刷 or 立體列印 or 立體光固化 or 立體造型 or 立體成型 or 立體噴印 or 立體噴墨 or 立體噴塗 or 積層列印 or 3D列印 or 3D列表 or 3D打印 or 3D打印 or 3D[1,5]列印 or 3D印表 or 3D印表 or 3D印刷 or 3D印刷 or 3D印製 or 3D印製 or 3D噴印 or 3D成型 or 3D成型 or 三維積層 or 3D積層 or 3D *print* or three dimension* *print* or 3DP or 積層造型 or 積層造形 or 積層列印 or 積層製造 or 附加[1,3]製造 or 添加[1,3]製造 or 加法製造 or 加成製造 or 增材製造 or additiv* manufactur* or laminat* shap* or 熔融沉積 or 沉積成型 or 熔解積層 or fus* deposit* model* or fus* deposit* mold*)

韓国特許では以下のようになります。

(3차원[1,4]프린터 or 3차원[1,4]프린팅 or 3차원[1,4]프린트 or 3차원[1,4]인쇄 or 3차원[1,4]인쇄 or 3차원[1,4]프린터 or 3차원[1,4]프린터 or 3차원 출력 or 3D[1,4]프린팅 or 3D[1,4]프린터 or 3D[1,4]프린트 or 3D[1,4]인쇄 or 3D 프린터 or 3D 프린터 or 3D 프린팅 or 3D 프린트 or 3D 프린팅 or 3-D 프린터 or 3D 프린트 or 3D 인쇄 or 쓰리디 프린터 or 쓰리디 프린팅 or 쓰리디 프린트 or 있는 삼차원 프린터 or 삼차원 프린터 or 삼차원 프린팅 or 삼차원 인쇄 or 삼차원프린트 or 입체 인쇄 or 입체 프린터 or 삼차원 출력 or 3D 출력 or 3D print* or Three dimension* print* or 적층 제조 or 적층적 제조 or 적층 가공 or 부가적 제조 or 부가적인 제조 or 부가식 제조 or 부가 제조하기 or 부가물 제조 or 첨가 제조 or 첨가식 제조 or 첨가물 제조 or 첨가제의 제조 or 적층 조형 or 부가적으로 제작된 or 애디티브 제조 or 첨삭 가공을 or additiv* manufactur* or laminat* shap* or 용융 침착 모델링 or FDM or FDM or fus* deposit* model* or fus* deposit* mold*)

韓国特許のKIPRIS検索ではスペースがあるか(”3차원 프린터”)、ないか(”3차원프린터”)で検索件数が変わりますが、GPSではいずれも同じ結果を返します。

2000-2019年公開特許「発明の名称」

kipris検索

このようにいくつものデータベースを使わずとも無料のGPSシステム1つで英語と原語を対比して検索用語を抽出できて便利です。中国語の簡体字も難しそうですが単語単位であれば(日本人ですから)何となくわかる場合もありますが、ハングルではGoogle翻訳ツールのお世話にならないとまったくわかりません。

3.誤記・誤訳?

Hydroxyl(-OH)とCarboxy(-COOH)の英語誤訳について、羟(hydroxy)をcarboxy(羧)と誤訳していたり、羧(carboxy)をhydroxy(羟)と誤訳している例やスペルミス、誤訳が中国大陸特許に存在する例などを紹介しました(Espacenetで東アジアの特許調査(その2))。GPSで台湾特許まで含めて見てみると数こそは少ないですが、誤記・誤訳が存在することも確認できました。

これらは原語から英語翻訳への誤訳ではなく、代理人事務所に提出した英文明細書を事務所が中国語に変換する際に誤訳(誤記)したものかもしれません。誤訳が多いのは外国出願人かどうか調べてみれば何かわかるような気もします。

このような誤訳か誤記かわからないような例をもう少し挙げてみましょう。やはり化学用語なので恐縮ですが、誤訳(誤記)の多い代表としてpolyurethaneを挙げてみます。身の回りでもスポンジや靴底などに使われているものです。polyurethaneの異表記には以下のようなものがありますが、誤訳(誤記)もそこそこあります。

中国語(漢字)をその化学構造とリンクして見てみると理解が深まることもあります。こんなもん見たってわからない(わかる気もしない)という「御仁」もおられるとは思いますが。

化学構造図

N原子を表す中国語としては氨、胺、安などがほぼ同義として使われています。

Polyurethaneの異表記

(聚氨酯 or 聚氨基酯 or 聚氨脂 or 聚氨酸酯 or 聚氨酸脂 or 聚氨甲酸 or 聚氨甲酸乙酯 or 聚氨基甲酸酯 or 聚氨基甲酸脂 or 聚氨基甲酸乙酯 or 聚亞氨 or 聚胺氨基甲酸酯 or 氨基甲酸酯 or 聚胺酯 or 聚胺脂 or 聚胺甲酸酯 or 聚胺甲酸脂 or 聚胺基甲酸酯 or 聚胺基甲酸 or 聚胺基酸酯 or 聚胺甲酸乙酯 or 聚胺酸酯 or 聚胺基甲酸 or 聚胺甲酸乙酯 or 胺基甲酸酯 or 胺基甲酸乙酯 or 胺聚甲酸 or 聚安基甲酸脂 or 聚安基甲酸脂 or 聚安酯 or 聚亚氨酯 or 聚亚胺酯 or 聚安亚酯 or 聚亚安酯 or 聚酯亚胺 or 聚氨酷 or 聚氨醋 or PU or PU* or *PU or *PU* or PU or *TPU or SPU)          繊維関係のpolyurethaneの一文字表記は次節で紹介するので省略しました。

中国大陸特許のpolyurethaneの誤記(誤訳)例です。数字は2000-2019年公開特許の「発明の名称」中のものです。

1)polyethylene の略表記PEをpolyurethanとする例(10件)

しかもわざわざ英訳で「PP/PE (polystyrene /polyurethane)」「PE (polyurethane)」「polyurethane (PE)」などとしています。polyurethane の略称は「PU」です。

2)聚酯(polyester)をpolyurethaneとする例(9件)

台湾でも「聚酯發泡」をpolyurethane foamとする例があります。確かにpolyester系のpolyurethaneというものもありますが、「聚酯」の表記をpolyurethaneと読むには無理もあります。

3)硬质泡沫、发泡胶をpolyurethane foamとする例(5件)

要約や請求の範囲まで拡げて確認すれば硬质泡沫、发泡胶もpolyurethane foamと読めるかもしれませんが、発明の名称の中国語だけではpolyurethane foamとは読めません。誤訳とは言わないまでも難しいものがあります。

「发泡胶」は素直に訳せば「foaming rubber」だと思いますが、それぞれ以下のようにも訳されます。数字は2000~2019年公開中国大陸特許、発明の名称です。

「发泡胶」の英訳

foam* rubber                   10
foam* adhesive*              34
polyurethane foam*          27
polystyrene foam* or expand* polystyrene or Styrofoam   27

foaming glue, foaming gel, foaming colloidalならまだしも「发泡胶」からどうやってpolyurethane, polystyreneと英訳できるの!、と問いたい。

・聚橡をpolyurethane-rubberとする例(1件)

これもどこにpolyurethaneが潜んでいるの!、と。「聚橡」は圧倒的に共聚橡胶(copolymer rubber)という使い方が多い。

揚げ足を取ればまだまだ・・。

また、台湾特許では、聚酯, 聚烷, 聚樹脂などの文字化け文字(WEB上や日本で使われているパソコンでは表示できない)がpolyurethaneと英訳されている例もあります。中国、台湾の文字化け文字については別稿で紹介予定です。

このように英語検索で抽出した集合の中には様々なノイズが含まれてきますので査読するのも大変です。

4.一文字表記

漢字(中国語)一文字が特定の用語を意味するものについても見ておきましょう。検索式を立てる際に悩ましいものの1つです。一文字表記は多くの分野でも存在しますが、繊維関係の用語例で紹介しましょう。

単一の素材からなる繊維を「単一繊維」と定義し、複数の素材を組み合わせた繊維を「混紡」と定義することにします。一文字表記で問題となるのは混紡繊維です。

まず、単一繊維で見てみましょう。様々な素材の繊維がありますのでここで各繊維を網羅することはできませんが、ナイロンまたはポリアミドとも呼ばれ、中国語でナイロンは「锦纶, 尼纶, 尼龙, 尼纤维, 尼丝纺, 锦丝纶」のように表記され、ポリアミドでは「聚酰胺, 聚芳酰胺, 多酰胺, 聚酰氨, 聚酰酸胺, 聚酸胺」などと表記されます。これらは通常の異表記と同様に抽出できます。(ナイロンまたはポリアミドの英語異表記もpolyamideの他、「nylon, chinlon, caprolactam, Jinlun, kapron」などのように耳慣れない表記もあります。)

さらに、中国大陸特許で「涤纶」は、「polyester」「terylene」とも英訳されますが、polyster(polyester)やlerylene(terylene)のようなスペルミスもあります。中でも、polysterは2000-2019年、大陸公開特許、発明の名称中に20件も存在します。

誤訳も中国大陸特許では、存在するのが当たり前となりました。涤纶(polyester)がPET, nylon、锦纶(nylon)がpolyester、棉纶(cotton faiber)がpolypropylene, polyamideなどと誤訳されています。

また、GPSでは、簡体字で台湾特許が、繁体字で中国大陸特許が検索できますが、台湾特許で「锦纶, 尼纶, 尼龙, 尼纤维, 尼丝纺, 锦丝纶」(Nylon fiber簡体字の表記)と検索しても繁体字に自動変換して検索してくれません。台湾でNylonは、「耐隆, 尼龍, 耐綸, 耐龍」のような用語が充てられています。中国大陸の「纤维」(fiber)で台湾特許を検索すると「纖維」を抽出しますが、「纖維」で大陸特許を検索しても簡体字に変換されません。検索結果は0件です。

必ずしも簡体字が繁体字に、繁体字が簡体字に自動変換するとも言えません。

その他の単一繊維としては「乙纶(polyethylene fiber)」「丙纶(polypropylene fiber)」「棉纶(cotton fiber)」「涤纶(polyester fiber)」「氨纶(polyurethane fiber)」などと繊維素材用語に「纶」を付けて表します。

「乙纶, 丙纶, 棉纶, 涤纶, 氨纶」などは、やはり繁体字に自動変換して台湾特許を抽出してくれません。では、台湾ではこれらの用語としてどんな繁体字が当てられているかもついでに見ておきましょう。

大陸:台湾
乙纶:聚乙烯纖維
丙纶:聚丙烯纖維
棉纶:棉纖維
涤纶:聚酯纖維 or聚酯系纖維
氨纶:聚胺基甲酸酯纖維 or聚胺基甲酸乙酯纖維

台湾では略記されないようです。

次に問題とする一文字表記について繊維の混紡といわれる異なる種類の素材を組み合わせた繊維用語について見てみましょう。混紡繊維は、polyesterとpolyamideでは「涤锦 or 锦涤」、polyesterとcottonでは「涤棉 or 棉涤」、nylonとcottonでは「锦棉 or 棉锦」、nylonとpolyurethane「氨锦 or 锦氨」のようにそれぞれの一文字ずつから構成された用語(反転用語も)をフレーズのように使います。

「涤锦 or 锦涤」などでは、「涤/锦 or 锦/涤」のように間にスラッシュの入った表記もありますが、これはすべて「涤锦 or 锦涤」で抽出できます。

「涤 and 锦」とすれば、当然、「涤/氨及锦/氨」のようなノイズを拾うので、少なくとも「涤纶 and 锦纶」のようにすべきです。

混紡繊維の誤訳も結構あるので注意が必要です。誤訳例の一部を紹介します。

・粘锦(viscose-cotton)
・棉涤(cotton-nylon or cotton and nylon)
・涤锦(polyester cotton)
・棉锦(cotton polyester)

これら混紡繊維の繁体字も確認してみると

  大陸   :  台湾
「涤锦 or 锦涤」:聚酯-聚醯胺
「涤棉 or 棉涤」:聚酯/綿 or聚酯棉
「锦棉 or 棉锦」:尼龍與棉 or棉與尼龍
「氨锦 or 锦氨」:聚胺基甲酸酯.尼龍

とこちらも台湾(繁体字)では、略表記されていません。

繊維分野で使われる「丝」(台湾では「絲」と表記)はyarnやfilamentと訳されますがwireその他にも翻訳され、ややこしいです。「纺丝」「纺线」「纱线(単に线だけでも」spinningと訳されます。中国語(台湾も含め)はできるだけ2文字以上のフレーズで辞書登録するようにしているが、そうもいかないことも多い。中国語は奥が深い。

5.その他、検索用原語情報の抽出にGPSが便利な理由

別に台湾特許庁の無料特許データベースGPSの代理店をしている訳でもありませんが、GPSでは原語情報と英語情報が同時に確認できる、中国や台湾、韓国など(一応)Worldwideな特許情報が抽出できるなど利点も多く便利です。

これまで中国情報は、CNIPRで原語情報と英語情報の画面を切り替えながら確認したり、またはデータをダウンロードして比較しなければならず面倒でした。

GPSで英語用語を利用して中国大陸特許を調査する場合には、原語(簡体字)はタイムラグも短く収録されていますが、英訳の付与が若干遅れるので英語情報のみから検索するのは危険です。英語情報付与のライムラグを認識していれば有効に活用できます。

いずれにしても1つのデータベースだけで済ますわけにはいきません。特に、網羅的な権利関係調査(クリアランス調査)ではデータベース収録内容の誤訳、スペルミスなどを考慮して複数のデータベースで確認することが重要です。

複数DB

図6.複数のデータベースで調査

以上