異表記・誤訳に関する検索Tips連載に当たって

2021年4月1日
アジア特許情報研究会:伊藤徹男

1.はじめに

これまで各所における中国特許調査講座で、中国語簡体字の英語表記(英訳)にはわずかですが誤訳が存在し、英訳異表記や英訳誤字・脱字(誤表記)なども多数存在するために、それら英語表記を網羅して検索式を立てて検索するのは並大抵のことではない。現時点で把握する限りの英語異表記を並べて大まかに検索し、その英語検索で洩れるものを中国語で補完検索することが重要であることを力説してきました。
特に、権利侵害調査や無効化資料調査では検索洩れが許されないので「英語+中国語検索」(ハイブリッド検索)が必須であることを訴えてきました。

無料データベースならともかく商用英語データベースにそれほど欠陥があるはずがないし、中国語が読み書きできないサーチャーが中国語で検索する、などはやっていられない、ということを言われる方がいるのは残念です。出願前の先行技術調査や研究者が関連ある技術を把握するために調査する、というような場合にまでハイブリッド検索を求めるものではありません。

中国特許の異表記や誤訳については、英語も中国語も圧倒的に簡体字に多く見られ、台湾特許の繁体字では少ないという特徴もあります。1つの英表記に対し10を超える中国語訳もあれば、逆に1つの中国語に10を超える英語訳もあります。このような異表記や誤訳は「用語」だけでなく「出願人」でも存在します。

検索するたびに異表記や誤訳を収集するのは非効率なので、私は「ゆれたん」という用語・出願人辞書をWEB上に置いてどこからでもアクセスできるようにして利用しています(https://yuretan.kaisei1992.com/)。以前はエクセルで管理してきましたが、重複して登録したりして非効率だったのでデータベースとして構築してもらいました。
この「ゆれたん」も現在は非公開で特定の方にしか公開していませんが、いずれ近いうちに一般にも公開し、多くの方々に利用していただきたいと思っています。

今後、ほんの数例ですが、このような異表記や誤訳についてこれまで紹介してきたものも再掲する形で「検索Tips」として改めて紹介していきたいと思います。自分自身でも「こんな異表記、誤訳についてはどこかで紹介したけど・・」と探し回ることもあるので備忘録として「ゆれたん」のようにどこからでもアクセスして参照できるようにしたい、というのも目的の1つです。

中国語の文法はおろか中国語の読み書きや会話もできない私が中国語の異表記や誤訳を論じるのだから大した内容ではない、と思われても仕方ありません。独りよがりな思い込みですが、「日本のサーチャーの多くは(ほとんどとも思っています)私のように中国語の読み書きができずに中国特許調査を担当している」と思っていますので、そのような方の参考になれば幸いです。

紹介する用語や出願人も異表記が多いものや誤訳があるものなどをそれぞれ議論しながら進めますが、系統的に紹介するものではないのでまとまりがないものとなるかもしれません。ご了解ください。
取り上げた用語に関する異論、あるいは「こんな異表記もあるよ」などの提案もお受けいたします。異論やコメントは、研究会メンバーであれば本「検索Tips」上に、研究会メンバー以外の方は研究会のゲストブック(https://gbook.sasiapi.org/)または「tito94@sasiapi.org」のアドレスまでメールいただければ幸いです。

2.異表記と誤訳の定義

最初に、この検索Tipsで紹介する異表記と誤訳について定義しておきたい。異表記とは「同じ内容を指すが表記が異なるもの」と定義します。例えば「太陽電池」の英語表記としては「solar cell(s)」と「solar battery(ies)」という英表記が知られていますが、「photovoltaic cell(s)」も太陽電池の英語異表記として使います(「photovoltaic」だけで使われることも多い)。これらの英語表記に該当する簡体字中国語としては「太阳能电池, 太阳电池, 光电池, 光伏电池, 光伏发电」などがあり、いずれも「同じ意味を持つもので表記が異なるもの」です。同義語とも言われます。
化学用語polyamideと汎用語nylonやlaminateとmulti layer(s)なども英表記は異なりますが、同じものを指すとして異表記として扱います。

誤訳は「意味が異なるものに訳されたもの」または「間違った翻訳」と定義しておきます。スペルミス(脱字を含む)なども誤訳の範疇に入るかと思いますが、ここでは誤訳とは別に「誤表記(誤記)」と定義して区別したいと思います。スペルミスなどの誤記は忖度して査読すれば正しい訳にたどり着けますが、誤訳はそうはいきません。

例えば、「聚乙烯(polyethylene)」という簡体字中国語が「polystyrene」と英訳されている例がありますが(AN:CN201810713191.4など)、polyethyleneとpolystyreneは全く違うものですので、これは異表記ではなく誤訳です。
誤訳の場合には、「polystyrene」と英語検索してAN:CN201810713191.4などを抽出して査読したが、中国語の聚苯乙烯(polystyrene)の表記がどこにもなかった、ということになります。聚乙烯(polyethylene)がpolystyreneに英訳されているなど想像もつきません。

ちなみに、台湾特許庁GPSS(Global Patent Search System)では以下のように検索すると上記誤訳を抽出できます。
((聚乙烯 and polystyrene) not (聚苯乙烯 or PS or HIPS or polyethylene or PE))@ab
中国語で聚乙烯がpolystyreneと訳されているが、同一センテンス中にpolystyreneの中国語や略語(聚苯乙烯 or PS or HIPS)およびpolyethylene、PEの英訳が含まれていないもの。

他方、「polycthylene」のようなスペルミス(誤記)は、検索で「polyethylene」として抽出できませんが、容易に「polyethylene」と読むことができます。
これも以前に紹介した化学物質でAzobisisobutyronitrileというものがあり、やはり英語表記には様々なスペルミスも存在しますが、その「nitrile(CN)」に該当する中国語が「腈, 氰, 睛, 晴」などと表記されていますが「睛, 晴」は「腈」の誤記ではないかと思われますが、それぞれ異表記としての用法があります。

出願人名の誤訳例では「现代自动车(Hyundai Motor)」が「Toyota Jidosya」と英訳されているものなどは共願でない限り、誤訳と言えます。いずれも次回以降の具体例で詳細を議論したいと思います。

誤訳は原語を英訳する場合だけでなく、英語情報を元に原語に翻訳する際にも生じたもの(出願時の誤訳)もあると思われます。網羅的な調査では意に反してこれらの誤訳も検索用異表記として使うこともあります。

「異表記、誤訳」の定義も人により若干違うかもしれません。それぞれの定義を否定するつもりもありませんが、最近、研究会内で明らかに「異表記」と思われる中国語からの英訳を「誤訳」と議論しているのには違和感を覚えます。あくまでも上記したような私なりの異表記と誤訳の定義で中国語の問題点を議論できればと思っています。

ここで整理しておきたいのは、英訳にしても中国語訳にしても「不適切な訳=誤訳」としないことです。私は、「適切な訳+不適切な訳=異表記」と捉えて「誤訳」と区別しています。そして、スペルミスなどの誤記は不適切な訳としています。同一の用語や出願人名に異表記が多いのも困ったものですが、誤訳は見当もつかない英語訳や中国語訳になっているので発見するのも厄介です。

また、中国特許の誤訳は「機械翻訳によるもの」とされることが多いようですが、同じセンテンス中に誤訳と正訳が現れるなど、機械翻訳の問題ではなく明らかに「人間翻訳によるもの」と考えています。このような多様な誤訳を生成するのは人間にしかできない仕業ではないかと。

3.異表記、誤訳に関するこれまでの紹介記事

  1. アジア・新興国特許調査における原語抽出法(INFOPRO2019)
  2. 中国語検索が必要な理由を「用語」「出願人」のそれぞれについて紹介(2018/4)
  3. 中国特許情報講座(1)(2019/9)          中国語の異表記・誤訳など
  4. 中国特許情報講座(2)(2020/1)          中国語の抽出法
  5. 権利移転情報と出願人・権利者英表記の誤表記(INFOPRO2016)
  6. 中国・台湾特許情報の異表記について(2020/7)
  7. 中国・台湾特許の異表記、誤訳(2020/8)

あとがき

ここで取り上げる「異表記、誤訳」検索Tipsは、単に異表記が多い用語について取り上げるだけでなく、その中に含まれる英語や原語の誤訳、ユニークな表現方法などについて議論していきたいと思っています。また、台湾の化学用語に散見される文字化け文字の抽出などについてもセミナーでその数例しか紹介していませんので、これについても議論していきます。

原則として少なくとも月に1件は報告したいと思っていますが、まずは、異表記、誤訳のわかりやすい具体例として出願人の異表記、誤訳について取り上げる予定。2021年度も今日から始まりますが、早速来週には第1報を紹介の予定です。

私が会社で担当させていただく調査は、どちらかというと先行技術調査より無効化資料調査、権利侵害調査の比率が高いように思います(もちろん、先行技術調査やSDIなどでの英語検索の補完としての調査もありますが)。
先行技術調査では数千件の集合の中で数件洩れるようなことがあっても問題になることは少ないですが、権利侵害調査ではそうはいきません。特に、社内からの依頼だけでなく社外からの無効化資料調査、権利侵害調査依頼も比較的多い状況ではまさに万全を期して臨みます。「重要な特許が1件洩れていました、すみません」では済まないのです。信用を害せば2度と調査依頼がこないかもしれません。そのような観点からひじょうに些細な異表記や誤訳にもこだわって取り組んできました。

以上