検証Global Patent Search System(GPSS)データベース

2020/11/8
アジア特許情報研究会:伊藤徹男

台湾特許庁のWorldwideな検索が可能なデータベースGlobal Patent Search System(GPSS)について台湾、中国(大陸)、韓国のデータ収録の概略として公報発行年から求めた数値を前回(2020/7)紹介しました。しかし、発行年からの数値だけでは、発明の名称や要約、あるいは出願人やIPCなどの検索タームが収録されているとは限りません。

ここでは具体的な検索タームを用いて台湾、中国、韓国の各知財庁の代表的なデータベースと検索比較することでその実力を検証しました。

1.検証方法

1)比較検証データベース

台湾特許:TWPAT/ GPSS
中国特許:日本版CNIPR / GPS
韓国特許:KIPRIS / GPS

2)検索期間等

台湾、中国、韓国特許:2010-2019年発行の公開特許
公報発行日基準で検証しているので出願日基準とは異なり、検証結果が情報の更新によって左右されることはありませんが、すべて2020/8/5に検証したものです。

3)検索ターム

用語:3D PRINTERに関する英語と原語
英語、原語それぞれに10を超える異表記が存在しますが2~4の異表記に限定
出願人:各国の代表的出願人各2社
IPC:3D PRINTERに関する代表的なIPC(B29C64、B29C67、B33Y)

2.検証内容

1)用語の検証

原語だけの比較だけでなく、英語タームの収録についても確認した結果を表1に示しました。

表1.収録用語の比較

表1_収録用語の比較

(表中の*, %などのワイルドカードはデータベースごとに異なりますので、それに従い検索を実施しています)

台湾、中国、韓国とも原語検索では各知財庁データベースとほぼ同等の収録でした。

台湾と中国の原語検索では、先に「中国・台湾特許情報の異表記について」でも紹介しましたようにprinterの常用語として、台湾では「列印」が多用され、中国では「打印」が多用されていることも確認できました。

「中国・台湾特許情報の異表記について」

GPSSの英語情報

「発明の名称」「要約」では各知財庁データベースよりGPSSの方が英語情報の付与が多いことを示していますが、台湾、中国特許の「請求の範囲」と「詳細な説明」へのGPSSの英語情報付与が極端に少ないこともわかりました。台湾特許ではTWPATと同等の付与でそれを超える付与は見られませんでした。機械翻訳でも構わないので「請求の範囲」と「詳細な説明」には英訳を付けてほしいところです。

GPSSの中国特許「発明の名称」「要約」における「three dimension% print%」についてはCNIPRとGPSSで大きな開きがあります。公報番号等から両者のデータを詳細に検証する必要があります。検索結果一覧の発明の名称をざっとみたところでは、いずれも「three dimension% print%」が存在するので問題なさそうですが。

韓国特許についてはKIPRISの英語情報収録がGPSSに比べて不充分であることがわかりました。KIPRISの「要約」英語は韓国特許情報院(KIPI)の英語データベース(KPA)からの情報を転載していることも原因と思われます。KIPRISとGPSSの英語情報収録の差についても、さらに検証が必要です。

また、KIPRISの「発明の名称」におけるハングル表記と英語訳は必ずしも一致するものではないことは従前から知られていますが、GPSSの英語情報はどのように入手しているのでしょうか。独自に機械翻訳または人手翻訳しているのでしょうか。

台湾においては、同じ案件(出願番号TW107125014)でもTWPATには英語要約が未付与(図1)であるにも拘わらず、GPSSでは英語要約が付与されている(図2)などにより、英語検索数が多くなっているものと思われます。

図1_TWPATの要約

図1.TWPATの要約

図2_GPSの要約

図2.GPSの要約

2)出願人の検証

台湾、中国、韓国の代表的な出願人各2社について各庁データベースとGPSSの収録比較を英語表記、原語表記および両者をプラスした収録数で表2に示しました。

検索条件は2010年~2019年公開特許件数としました。

表2.出願人の比較

表2_出願人の比較

検証検索式やワイルドカード、フレーズの検索などはそれぞれのデータベースに従い実施し、検索式を簡略化するため、抽出件数の後ろに *1)などと番号を付与して差分の検証をしています。

【台湾出願人】

TWPATとGPSSは共に台湾特許庁データベースであるのでいずれも同条件では同数を示し、差分も同様です。

*1) not *2) の差分では、台灣半導體股份(TAIWAN SEMICONDUCTOR)の中国語スペルミスや台積太陽能股份(TAIWAN SEMICONDUCTOR)の英語誤記(?)などわずかに6件です。「台積太陽能股份」は「TSMC SOLAR」の英訳で別途、50件の出願がありますから中国語か英語の誤記だと思います。

*2) not *1)では、原語(台灣積體電路製造)はすべて英語表記TAIWAN SEMICONDUCTORに含まれ、0件です。

*5) not *6)では、QUALCOMMの繁体字異表記「奎康公司」が24件抽出されます。

*6 not *5)では、原語表記は英語表記QUALCOMMにすべて含まれ、0件です。

【中国出願人】

「珠海格力电器」については、主要な英訳として「GREE ELECTRIC」と「GELI ELECTRIC」の異表記が存在しますが、それぞれの出現数は以下の通りです。

表3.珠海格力电器の英訳異表記

表3_珠海格力电器の英訳異表記

CNIPRには、「珠海格力电器」のその他の英語異表記、誤表記などが存在しますが、ここではさらなる内容を検証していません。

*13) not *14)では、中国語「华为技术」の表記がないにも拘らず「HUAWEI TECH%」で「华为终端, 华为数字技术, 华为软件技术」などの関連会社48件が抽出されます。

*14) not *13)では、Hua Wei Technology, HUAWAI TECH, HUAWEI Research Technologyなど異表記、スペルミスの他、「FUTUREWEI TECHNOLOGIES」の20件を含み、27件存在します。CNIPRでも確認しましたが、「华为技术」が「QUALCOMM INC」と誤訳されている例(AN:CN201680005649.X)などもあります(図3)。

図3_「华为技术」が「QUALCOMM INC」と誤訳

図3.「华为技术」が「QUALCOMM INC」と誤訳

「公開特許だけでも1000万件もある中、わずか数件の漏れに一喜一憂するのもどうかと思う」という方もおられるでしょう。権利侵害調査や無効化資料調査では誤訳、スペルミスは困るのです。

【韓国出願人】

KIPRISにおいては、

*17) not *18)では、0件(すべてハングル表記(“삼성 전자” + 삼성전자)でカバー)

*18) not *17)では、「SAMSUNG ELECTRONICS」の英訳がなく、「Samsung Display」の1564件(別途、66件のSAMSUNG ELECTRONICSとの共願あり)を筆頭にKoninklijke Philips, HUAWEI TECHNOLOGIES, HEWLETT-PACKARD, HP Printingなど2401件が「SAMSUNG ELECTRONICS」以外で英訳されています。

*19) not *20)では、33180件となりますが、GPSSの出願人のハングル未付与が原因です。

また、SAMSUNG ELECTRONICSと紛らわしい出願人として「삼성전기주식회사(SAMSUNG ELECTRO-MECHANICS(サムスン電気))」がありますが、関連会社であってもSAMSUNG ELECTRONICSとしてカウントできませんね。

*21) not *22)では、0件(すべてハングル表記(엘지전자)でカバー)

*22) not *21)では、「KOREA ELECTRIC POWER, ZKW GROUP, Yonsei University」など「LG ELECTRONICS」以外の英訳が70件存在します。

GPSSでも(엘지전자 not LG ELECTRONICS)は70件となりますが、こちらは英語訳が付与されていませんので検証ができません。

各国特許庁関係のデータベース(TWPAT、CNIPR, KIPRIS)とGPSSとの差分などの直接の比較をデータベース上では実施できませんが、データの一部(さらに期間を限定するなどして)をダウンロードして比較検証してみたいと思っています。

3)IPCの検証

3D PRINTERの主要IPC(B29C64, B29C67, B33Y)についてデータベースの比較をしたものが表4です。

表4.IPC比較

図4_IPC比較

台湾、中国ではほぼ同等と捉えることができますが、韓国では大きな差が見られました。韓国についてKIPRISとGPSSで検証してみる予定ですが、公開日を2019年に限定してデータを比較すべく検索した結果は以下です。この程度なら検証できそうです。検証結果は次回報告します。

 B29C64           KIPRIS(427件)/GPSS(442件)
 B29C67           KIPRIS(47件)/GPSS(36件)

表5.韓国各年別のIPC推移

表5_韓国各年別のIPC推移

 

詳細な検証はさらに必要ですが、3D PRINTERに関するこれらのIPCは比較的最近、新設または更新されたものであるので、参考情報として古くから付与されている積層板と半導体のIPCとも比較してみました。

表6.参考情報1

表6_参考情報1

これらについては顕著な差は認められなかったので、やはり3D PRINTERに関するIPCについては再検証してみたいと思っています。

さらに、韓国情報と同様に、台湾、中国についても発行年推移を表7に参考情報として示しました。

表7.参考情報2

表7_参考情報2

4)データ収録のタイムラグ

各国のデータ更新日は以下のようになっていますが、GPSSへのデータ収録タイムラグはどの程度か確認してみました。データ取得日:2020年8月5日

台湾:公開公報 毎月1日、16日
公告公報 毎月1日、11日、21日
中国:公開、公告共に毎週火曜、金曜
韓国:公開、公告共に土日、韓国の祭日を除き、毎日

台湾のGPSSの収録、タイムラグは台湾特許庁TWPATと同じですので割愛しました。いずれも2020年7月以降のタイムラグですが以下のようになりました。

表8.データ収録タイムラグ

表8_データ収録タイムラグ

台湾情報はもちろんタイムラグなし、ですが、中国は約2週間、韓国は約3週間であることがわかりました。収録タイムラグの商用データベースとの比較はしていませんが、結構短いと思います。

5)GPSSの収録国

さらにGPSSはWorldwideな国をカバーしていることもアピールしていますので各国の収録についても確認しました。ここでも各国庁データベースや商用データベースとの比較はしていません。

表9.GPSSの各国収録(主要国)

表9_GPSSの各国収録(主要国)

表10.GPSSの各国収録(Worldwide)

表10_GPSSの各国収録(Worldwide)

発行日2000-2019で検索。

ここで「公開」「公告」とあるのは、GPSSでの定義によります。特に、「公告」には公告(登録)特許の他、実案なども含まれます。TW, CN, KR, JP, US, EPについては「設計(意匠)」のチェックボックスも用意されているので「公告」に意匠が混在することはないとは思われますが、他の国の場合には意匠が混在しているかもしれません。

東アジア以外の有益と思われる国については後日、各国特許庁との収録も確認するなど詳細を解析してみたいと思います。

6)その他

「中国大陸特許が繁体字でも検索可」

台湾特許庁データベースTWPATおよびGPSS共に、中国大陸の簡体字で検索しても繁体字に自動変換して検索可能となりましたが(2015年)、GPSSでは中国大陸特許も繁体字で検索できます。台湾特許庁は何と寛容な特許庁でしょうか。

繁体字で発明の名称に「能量射線固化」を含む中国大陸の特許を検索してみると中国大陸特許が簡体字で「能量射线固化」と表示されます。中国大陸特許のGPSSの収録も良好なので実務でも使えるかもしれません。データのダウンロードは最大1000件のようですが、コマンド検索でCNIPRやTWPATと同様に扱えるというのはすごいことです。CNIPRは有料ですが、GPSS(TWPATも)は無料で使い放題です。

図4_繁体字で検索した中国大陸特許

図4.繁体字で検索した中国大陸特許

 

「GPSSを活用して原語用語を抽出」

中国語(簡体字、繁体字)でも韓国のハングルでも「発明の名称」からGoogle翻訳ツールと組合わせて原語抽出ができます。「発明の名称」ではなく、「要約」や「請求の範囲」からも同様に抽出できますが、結果一覧の「発明の名称」の方が簡便です。

図5_ハングルの用語検索例

図5.ハングルの用語検索例

図6_Google翻訳ツールでハングルを確認

図6.Google翻訳ツールでハングルを確認

抽出した異表記を、さらに、「((3D printer or 3D printing or 3D printable) not (3차원 프린팅 or 3D 프린팅 or 3D 인쇄 or 3D 프린트 or 3D프린터 or 3D 프린터 or 3차원 프린터)) @TI」のようにnot演算して0件となるまで繰り返せば異表記が網羅できます。もちろん、「3D printer」の英語異表記には「three dimensional printer」や「3D Color Printer」などもあり、英語表記も網羅する必要がありますが、そこまで厳密にしなくていい場合もありますから気軽に利用していただければ幸いです。

「GPSSの活用」

GPSSは東アジアや日本、欧米特許をそこそこ収録していますので、PATENTSCOPE(東アジアだけでなくASEAN各国の特許情報も原語で収録されています)と共に研究者や技術者に気軽に使っていただければ、と思います。

社内で商用データベースを契約して利用できる環境にあっても研究者などには解放されていない場合もあります。GPSSやPATENTSCOPEは無料で利用でき、接続場所も選びませんので自宅などから自身の研究内容に関連した特許が出願されているかなど、ゲーム感覚で使うことができます。

 

参照検索Tips

「台湾特許庁データベースGlobal Patent Search System(GPSS)」

【訂正とお詫び】

2020/7/15にリリースしましたGPSSに関するTipsは、「台湾特許庁データベースGlobal Patent Search(GPS)」としましたが、正確には「Global Patent Search Search (GPSS)」ですので前回のTipsもその呼称部分については「Global Patent Search Search (GPSS)」と修正しました。但し、表中の表記は「GPS」のままです。

本稿も8月初旬にリリースしたつもりでしたが失念していました。したがって、本稿で取得したデータも3か月前の8月5日のものであることをお断りしておきます。

以上