十個技巧充分挖掘專利分析的價值

如何分析海量增長的專利資訊,挖掘潛在價值?

 

本文作者:Parijat Oak,科睿唯安智權服務副總監 / Ed White,科睿唯安智權分析服務全球總監

 

專利是技術、市場和競爭資訊的寶貴來源。然而,公開的專利文獻總數已高達1.2億件,僅去年一年就新增630萬件。如何才能讓這些海量專利文獻為己所用?

專利分析為充分挖掘專利資訊的價值,提供了一條不可或缺且切實可行的途徑。通過專利分析,我們可以瞭解自身與競爭對手各自專利組合所具有的優勢、存在的不足和蘊含的機會,以及全球專利申請趨勢、技術全景、哪些地方可能存在空白領域等等。

專利分析要求透徹理解底層資料,這些資料的用法和用途,以及能夠解決的問題。德溫特專利分析服務團隊在開展專利分析方面擁有豐富的經驗和技術專長。下面與您分享有助於充分發揮專利分析價值的10個技巧。

 

#1:瞭解您的「鏡頭」

處理和分析專利資料的方法有很多種,但重要的是,知道在什麼時候,以什麼順序,使用哪種方法。選擇專利分析的適用方法與攝影有許多相似之處,如解析度、不同光學元件的功效和選取、數位變焦與光學變焦的取捨等。

舉例來說,正如您不會使用顯微鏡來觀察月球,您也不會使用FTO 檢索來審視一個技術領域的格局分佈。反過來也一樣,試圖通過專利全景分析進行如「可專利性」這樣的聚焦分析,也不可取。在進行專利全景分析時,需要使用數千個資料點才能對專利佈局進行有效詮釋。如果聚焦到僅查看三、四個資料點,這樣無異於將照片放大到幾個像素,只能得到模糊不清的圖像。

更好的做法,是按照一定的流程使用各種工具和方法。您可以先使用全景分析的方法來確定幾個具體領域進行宏觀分析,然後在下一步使用可專利性或FTO檢索的方法再來重新聚焦審視這些領域的某一局部。這相當於先使用望遠鏡選月球表面一個目的地區域,然後再發射一個探測器到該區域直接拍攝月球表面更加細微的圖像。雖然理論上也可以發射數千個配有攝影機的探測器到月球上,但顯然不切實際。這兩種方法一樣有價值,但適用的場景卻不一樣。在處理專利資料時,也必須考慮適用的方法和使用這些方法的時機。

 

#2:理解統計方式

專利資料集可能會非常複雜,尤其是同一個發明,可能產生大量專利申請。在很多公開的分析當中,提及「專利」這一表達時並未說明其含義。不同的統計方式可能對分析結果產生天壤之別。您必須清楚,這些具體數字指的是單件「專利」還是「專利家族」(「發明」)。如果不考慮這一點,您的結論可能站不住腳。一個簡單的規則是,要進行精確的專利分析,大多數情況下都可以先做「加法」,擴展資料集使其納入所有同族專利,然後再做「減法」,歸併統計專利家族的數量。使用德溫特世界專利索引 (DWPI) 資料,可以輕鬆實現這一點,因為 DWPI 資料庫的結構圍繞著世界各地不同專利機構所公開的一系列專利構建了德溫特專利家族,這使您能夠對發明進行分析,而不是僅僅對「專利」進行分析,因為對於許多(可以說是大多數)情景而言,分析「專利」的趨勢可能並不合適。

 

#3:深入研究,讓資料說話

幾乎所有分析都需要對專利資料進行清理。究其原因,所有專利資料庫的內容收錄都必須迎合最廣泛的用戶群體。與之相反,要讓您所做的分析實用有效,就必須針對規模更小的讀者群。這意味著需要將相關背景納入考慮。

清理專利權人資訊(即擁有該專利的實體),標引技術分類,以及總結發明的優點、用途和專利申請人類型等,這些背景資訊的清理能使專利資料更適合您的公司或組織。在這之後形成的所有圖表,會更加實用、易於解讀並對實際行動起到指導作用。

對於特定的分析專案,進行更深入的人工閱讀可能帶來額外的價值。通過人工深入研究,您將變身「偵探」,梳理出潛藏的情報,如所有權變更、隱蔽的合併、海外佈局、技術發展脈絡等其他資訊,發掘出資料背後想要講述的故事,即讓資料說話。

 

#4:僅使用專利分類號不足以支援深入分析

在考量技術分組(用途、優點、技術屬性等等)時,大家經常會使用專利檢索工具中各種不同的專利分類號,如國際專利分類 (IPC)、聯合專利分類 (CPC) 或德溫特手工代碼等,直接生成視覺化圖表。

然而,這些分類和代碼的主要目的在於輔助檢索相關主題,而非用於分析。要將這樣的技術分組與讀者能夠識別和理解的技術分類一一對應是非常困難的一件事,如果未經處理直接使用(如G01N 33/02),那麼,99%的讀者可能無法很快理解。

更理想的做法是,將資料和文本挖掘融入您的工作中:在使用分類代碼的同時,通過文本挖掘對文字內容進行分析,並將兩者結合識別出大眾可以理解的技術主題。

這通常需要工具、技能和時間,但有助於對原始專利資訊進行「翻譯」從而提煉形成解讀,從產品、研發專案、消費者/用戶益處和市場等角度,讓讀者可以直接讀懂。換言之,讓原始資料走出晦澀的「專利世界」,進入讀者所在的現實世界。

 

#5:瞄準資料背後的解讀,而非圖表

資深專利分析師深知,向不懂專利的讀者直接呈現或展示「原始」的專利數量統計、專利家族數量統計、引證程度和時間趨勢等,不難實現,但對於不瞭解專利的讀者而言,則很難從中得出結論,形成觀點和認知。

原始資料之間的相關性差、數值過於接近或差異性大等原因,都有可能導致不易視覺化進而難於理解。

最佳的實踐是,針對要回答的問題,建立分析模型,進而對趨勢進行解讀。

建模可以非常簡單,如按照從最小到最大的順序將資料點排序;也可以使用數學工具,將時間序列精煉為趨勢指標,抑或使用統計工具,如平均值、中間值和模態平均值等。

平均值在使用時需要小心,因為它們可能「隱藏」有價值的資料點,如數據的分佈情況,我們稱之為“the tyranny of the mean”。平均值在分析中佔有重要位置,但可能被誤用。多折線圖顯示數量隨時間推移而變化的情況,但可能極為擁擠,不宜觀察。可以將之轉換為數位,使圖表更容易進行比較。

其他更為複雜的模型包括,使用專利家族的多個指標來對發明進行打分和排序,然後在技術、申請人和時間等維度進行匯總。這類分析能夠有效發現誰擁有該領域最強的專利組合,以及哪些技術正快速實現商業化。

 

#6:充分利用專利審查員的引用資料

專利引用是眾所周知的影響力指標。一般而言,被引用的次數越多,該專利的影響力就越大(並且可能更有價值)。

然而,引用的力量往往被忽視。引用,特別是專利審查員的引用,本質上是加入了訓練有素的專利檢索員和技術專家對某件專利的意見,給出了類似技術解決方案的其他專利。這一點極為有用,如果應用資料科學原理,則可以對您的專利分析工作進行大範圍擴展延伸。

例如,通過分析您自身的專利組合的引用和被引用資料,並且限定於專利審查員的引用,繪製視覺化圖表,就可以快速發現誰正在研究與您一樣的技術問題。

這種類型的分析有若干優點:首先,這是一條捷徑 ─ 您不需要制定檢索式來找到接近的競爭對手;相反,您借用了專利審查員已經完成的工作。其次,如果您已經進行了技術檢索,那麼,這種分析依然有用,因為它可以起到核實、檢查的作用。第三,大多數分析都側重於全域、大資料點,本質上是「自上而下」來審視資料集;而這種類型的引用分析則是圍繞資料集提供「自下而上」的視角,快速找到傳統專利分析技術很容易忽略的小公司或技術/應用。

 

#7:視覺化設計和準確性同樣重要

我們受到的教育讓我們形成了很多根深蒂固的觀點,比如軸標題必不可少,並且需要圖表標題、軸刻度線和文字標籤等等。但實際上,只有在其他人要完全重複進行或者核實這些分析時,才真的需要這些東西,這種情況下,可能提供原始資料的效果更好。

一般而言,檢索平台都有分析資料和篩選出特定資料的功能;換句話說,可以對資料進行排序、篩選、點擊查看和疊加等操作。

如果您作為分析師的主要工作,是與別人交流從資料得出的結論,那麼,用資料視覺化先驅Edward Tufte的話來說,這些東西就是「圖表垃圾」。

從資料分析轉變為旨在交流的視覺化呈現,例如從檢索平台給出的圖表轉變為演講稿所用圖表,可能會很費事,需要作出各種調整。良好的視覺化設計是對讀者的尊敬,表明您在工作中確實對資料分析的結果進行了解讀,而不是留待讀者來完成。

事實上,如果我們進一步展開這一點,可以說,良好的視覺化設計與其準確性同樣重要。資料可能稍顯粗略,但結論相同;然而,如果不能得出結論,那麼分析則是毫無意義的。

一個視覺效果欠佳的好例子(其實是不好的例子!),是堆疊的橫條圖,或者任何形式的三維圖表。小的資料點往往最令人感興趣,但這些類型的分析使得小資料點最難被發現。更糟糕的是,在堆疊橫條圖中,看不出資料點彼此之間的關聯,這要求您的讀者在心裡默默進行歸納,靠眼睛來追蹤資料點。這在資料驗證分析中有用,但不適用於探索或交流分析結果。

如果您實在是很想創建堆疊橫條圖,那麼,不妨考慮改為一個精心設計的表格。

並非所有的分析都必須採用圖形;一個精心設計、簡潔美觀的表格可能更加強大,富含大量資訊,並且在形式上使您對資料的解讀一目了然。

需要為讀者著想 ─ 在進行任何分析時,都要多想一步:圖表是否可能引起誤導?有沒有一個能夠引領視線的趨勢?還有,請牢記一些基礎的心理學知識 ─ 讀者在面對任何分析時,如果需要花精力和時間來理解視覺化圖表所要表達的意思,那麼,他們不會花費那個時間。因此,您在工作中投入的時間被浪費了,因為讀者可能根本沒看您提供的內容。

 

#8:至多使用三種顏色

在視覺設計中,顏色是一個絕妙的工具。顏色可以讓視覺呈現更精美、更具風格,將目光吸引到重要資料點或關鍵解讀上。大多數分析師都使用顏色來區分他們認為需要區分的事物,如多個系列、資料類型、圓餅圖切片等等。但這是一把雙刃劍 ─ 對於任何圖表,顏色太多都會加劇干擾和複雜度,在資料與讀者之間豎起一道牆,讓讀者不容易理解。

使用不超過三種顏色有幾點好處:

  • 提供了一個標準配色體系,您可將之用於一系列視覺化圖表,作為一條理解和敘述的「線索」,使您的讀者快速跟上您的內容。
  • 可以避免建立過於複雜的視覺化圖表,如果您的設計使用三種顏色的效果不好,那麼,解決辦法不是增加第四種顏色,而是簡化或重新設計您的圖表,改善其效果。

我們建議您更進一步,投入一些時間,為您的工作建立一份設計指南 ─ 您要使用的三種顏色、字體標準和字體大小、背景色、圖表類型編目,以及精心設計的樣式等等。

一旦您完成了設計指南,就一定要遵守。設計指南是一個工具,可以抑制干擾和複雜度,同時,您在工作中會因此而避免需要再完全從頭設計新的圖表效果。

此外,還需要將配色與您的公司品牌聯繫起來,這有助於讀者瞭解並熟悉您的設計。保持一致性意味著一旦讀者理解了您的設計「規則」,他們就能快速理解您的所有其他圖表。雖然建立這樣一份指南需要您投入時間,但它今後帶來的效率提升,將是10倍的回報,與此同時,它將使您和分析師同事的工作成果更加清晰透明。

 

#9:順應資訊變化

再次以圖像作為類比,圖表是一張靜態的照片,僅限於單一時間點。而「影片」則包含了不同時間點上的圖像更新。專利分析亦如此。如果您並未從分析專案一開始就制定好定期更新的計畫,那麼,後期的更新往往極為困難,或者至少工作量巨大。

如果資料隨時間推移而發生的變化讓人產生興趣,那麼,您需要設計一個分析流程,以便監控追蹤這些變化,並且能夠在新出現的資料中按照既有資料的組織形式進行分析,這需要重複進行資料的清理、技術分類或專利打分等工作,因此,必須設計一套靈活的、便於重複的工作流程。

此外,必須清楚地認識到,隨著時間的推移,專利資料集會逐漸變化——不僅是將新的記錄納入您的分析,而且過去的已有資料點也可能發生改變。譬如,專利記錄可能變更所有權、引用次數變化、一項發明在哪些國家或地區提交了專利申請等。其結果是,完全更新的資料集(包含您已經分析過的記錄),與僅對某些「時間點」上的資料進行更新的分析之間存在差異。二者都很重要,但用途各不相同。

 

#10:切記您的目標是清晰度

分析師的任務是花費時間,運用技能來處理複雜資料,梳理出分析結果,形成對資料的解讀,然後盡可能高效地溝通您對資料的解讀。交流的效率並非取決於您的技能和工作,而是取決於受眾的時間和理解能力。您必須配合他們的時間限制,以及他們能夠理解吸收您所呈現的資訊的能力。

換句話說,不要以圖表的數量來衡量分析工作是否成功,而要看有多少人樂於參與並堅持到最後,以及有多少人聽懂了您的結論。

任何需要在工作中進行分析和呈現資料的人,都會遇到這樣的隱藏陷阱:處理複雜資料集所需的技能,創建高級統計模型的經驗,以及您將分析結果繪製成圖表所花費的大量時間,都很容易導致您的工作看起來十分複雜,也使旁人會因此覺得您為工作付出的巨大努力。不要這樣做!您的技能和努力工作的價值不在於複雜度,而在於簡練、樸素並且容易理解。

 

了解我們的專利檢索及分析服務