Espacenetで東アジアの特許調査(その1)

2020年7月21日
アジア特許情報研究会:伊藤徹男

Worldwideな無料データベースとして多くの方に利用されてきたEspacenet。インターフェースも大きく異なる新バージョンがこれまでβ版として運用されてきましたが、昨年秋に正式版となりました(ここでは「新Espacenet」と称します)。従来利用してきたものも「Classic Espacenet」としてしばらく運用されるようです。

新Espacenetについては、これまで断片的に関係者からブログなどでも紹介されてきましたので「少し触ってみた」という方もおられるでしょう。新旧Espacenetの詳細な検証データを比較したものについては現在、投稿準備中ですが、新旧で何が変わったのか、その概略を東アジア(中国、台湾、韓国)の情報について紹介しておきたいと思います。(その1)ではデータの収録状況を見てみましょう。

1.Espacenetのデータ収録

原庁データベースと考えられる中国(CNIPR)、台湾(TWPAT)、韓国(KIPRIS)と、やはりWorldwideなデータベースであるWIPOのPATENTSCOPEの収録についても併せて見てみました。

Espacenetでは今年3月以降、特に中国の検索をしたときに発明の名称、要約、出願人の情報中に中国語が目立つようになってきました(現時点では特許より実用新案の中国語情報が目立つようです)。2019年以前の情報中にもちらほら見られます。

韓国についても発明の名称、出願人名がハングルで表記されたものも見受けられますが、こちらはまだほとんど英語情報です。台湾については繁体字中国語での表記はほとんど見られません。

2017年以降、PATENTSCOPEにASEANをはじめ新興国の特許情報が原語でも収録され、英語+原語での調査が可能となりましたが、Espacenetでも同様に英語+原語での調査が可能となるのでしょうか。その一部の検証データは次回紹介します。

中国、台湾、韓国の収録状況をデータ取得年月で大きく左右されない「発行日」基準で公開特許について紹介しています。Espacenet での「発行日」は「最初に公報が発行された日」とされていますので、例えば、韓国のように公開前に登録公報が発行され、それについては公開公報が発行されませんので、そのような場合には発行日基準で検索した時には「公開前登録」情報が混入することがあります。

もちろん、出願日基準の方が出願傾向などを把握するうえで重要な場合もありますが、中国の場合には週2回、台湾では公開は月2回(公告は月3回)、韓国では土日を除く毎日更新されていますから、今日確認した情報も来週には既に古くなってしまいます。その点、発行日基準ではほぼ確定したデータとして確認できます。

以下の収録は、いずれも2020年4月26日現在のものです。

表1.中国特許情報の収録(中国公開特許CNA)

中国特許情報の収録

※CNIPR:中国知識産権出版社のデータベース

収録タイムラグでも確認しますが、中国特許情報の収録はほぼ問題ないと言えます。2013-2017年はPATENTSCOPEの収録が劣る部分(マーキング)もありますが、逐次追加される収録を確認していく必要もあります。

表2.台湾特許情報の収録(台湾公開TWA・公告特許TWB)

台湾特許情報の収録

※TWPAT:台湾特許庁(TIPO)データベース

公開制度が2003年に始まりましたが、ここには公告特許(TWB)も示しました。原庁のTWPATより収録が多い(緑)、および少ない(黄)理由は現時点では不明です。直近の収録タイムラグで紹介するようにEspacenetでTWA(公開)を検索してもTWB(公告)が混在し、TWB(公告)を検索してもTWA(公開)が混在するためではないかと推察しています。

表3.韓国特許情報の収録(韓国公開特許KRA)

韓国特許情報の収録

※KIPRIS:韓国特許情報院(KIPI)のデータベース

韓国庁(KIPRIS)よりPATENTSCOPEの収録が多いのは、発行年で検索すると「公開前登録」情報が混入するためであると思われますが、後日検証したいと思います。

一部、例外もありますが、すべての検索においてSmartSearch(Classic Espacenet)より新Espacenetの方が収録数は概して少なくなっています。この理由も現在把握できていません。

2.Espacenet収録のタイムラグ

中国や韓国特許などの原語収録については今年2月以降ちらほら程度なので現状では評価できませんが、東アジア3国についてのEspacenetの収録タイムラグを公開日で確認してみました。

各国庁からEPOに送られたデータがDOCDBとなり、Espacenetに反映される訳ですが各国情報がどのぐらいのタイミングでEspacenetに収録されているか検索することで確認してみました(実際にDOCDBに収録された情報を確認した訳ではありません)。

毎月の収録状況を表4に、更新日ごとの収録状況を表5および表6に示しました。単に発行日数(公開特許)をカウントしたものでデータに発明の名称などの書誌情報や要約などがどの程度収録されているかはここでは確認していません。これらの情報は別途発行予定の「新Espacenet」およびJapio Yearbook2020(2020/11予定)で紹介します。

以下の情報は、2020/7/20現在のものです。また、SmartSearch(Classic Espacenet)では10,000件以上の検索件数は表示されず、月ごと、あるいは日ごとで検索しなければなりませんが、10,000件以上の検索件数も示してくれるようになった新Espacenetでの数値をEspacenetの収録としました(同一検索式でもSmartSearchより若干検索件数が少ない、という問題は保留しておきます)。

表4.収録タイムラグ

収録タイムラグ

中国、韓国の収録はほぼ問題ないと言えるでしょう。韓国の収録には若干のタイムラグも見られます。台湾の収録はひどいものです。また、Espacenetで単にTWAで検索するとTWBのものも混在しますので上記表はpn=(TWA not TWB)としたものです。

表5.直近の収録タイムラグ(中国、韓国)

収録タイムラグ_中国韓国

中国CNIPRは毎週火曜、金曜にデータが追加更新されますので6月と7月について確認しました。中国特許情報のEspacenetへの収録タイムラグは約10日と意外に短く、収録率も高いことがわかりました。

韓国KIPRISは土日を除く毎日、原則としてデータが追加更新されています。韓国の収録タイムラグも3週間ほどで収録率もひじょうに高い。

表6.直近の収録タイムラグ(台湾)

直近の収録タイムラグ_台湾

台湾の公報発行は公開は毎月1日、16日、公告は毎月1日、11日、21日です。表6で「TWA_2」の列は、単にpn=TWAと検索したものです。Espacenetで「pd=20200101 and pn=TWA」と検索すると2201件が抽出されますが、公開前登録情報の271件がpd=20200101として抽出されます。つまり、pd=20200101 and pn=(TWA not TWB)の1936件が公告公報の混入のない公開公報ということになります。表6および表4の「TWA」はこのように公告情報を除いた数値として修正したものです。

毎月1日は公開公報と公告公報が発行されますが、公開情報と公告情報が同時に付与されていますので注意が必要です。尤もこのような検索は普段の調査では関係ないので無視していいでしょう。あくまでも情報収録の実態を確認したまでです。新Espacenetの一覧表示ではわかりにくいのでClassic Espacenetの結果一覧で示します。

pd=20200101 and pn=(TWA and TWB)として抽出した公開前登録情報(新Espacenetでは271件)

 espacenet_公開前登録情報

また、11日、21日は公告情報のみ発行され、公開情報は発行されませんが、TWAで2020/01/11(92件)、2020/01/21(84件)と検索されています。これも「公開前登録情報」です。

pd=20200111 and pn=TWAとして抽出した公開前登録情報(新Espacenetでも92件)

espacenet公開前登録情報2

逆に、16日は公開情報のみ発行され、公告情報は発行されません。なのに「pd=2020 0116 and pn=TWB」と検索すると126件が抽出されます。

「pd=20200116 and pn=TWB」と公告情報を検索したが、公開日付と公告番号がConfuseしています。

espacenet公告情報

このようにEspacenetでは、公開公報番号とその日付(公告公報番号とその日付)がリンクしていないので「日付」を基に、「2019年に発行された公開特許」などと検索する場合には注意が必要です。

Espacenetでは、ご存じのように出願日からの検索もできません。

Espacenetでの具体的な用語、出願人、IPCなどによる検索検証は次回に譲ります。

また、上述した「公開前登録情報」は、韓国についてはセミナーその他で紹介してきましたが、台湾の「公開前登録情報」と併せて別途、紹介したいと思います。

以上