首页 > 教育学习 > 为什么 > 如何获得一些比较全的公有数据?

如何获得一些比较全的公有数据?
2012-01-19 19:52:41   来源:   点击:

    如何获得一些比较全的公有数据?就是想了解下,我们一般获取一些数据有那些方法,比如我需要某个行业的企业的名单 ,不需要电话号码什么的隐私信息,但是互联网上的信息杂而全,自己归纳工作量太大,有没有什么简单的方法得到这些数据呢?

    1 个答案

    • 答案 1:

      先具體的回答如何得到「某个行业的企业的名单」:例:zh.wikipedia.org/w/api...中國製造公司&cmlimit=500&format=json (中國製造公司的名單)例:en.wikipedia.org/w/api... (中國的互聯網公司,雖然是英文的)詳細請參考[1]

        Freebase API

      例:https://api.freebase.com/api/servic...{%22query%22:[{%22type%22:%22/organization/organization%22,%22also:type%22:%22/business/business_operation%22,%22name%22:null,%22/business/business_operation/industry%22:%22Manufacturing%22,%22headquarters%22:[{%22citytown%22:{%22type%22:%22/location/location%22,%22containedby%22:[{%22name%22:%22China%22}]}}]}]} (中國製造公司)它或了一個叫做 MQL 的頗為複雜的查找語言,上面用到的 MQL 是:[{"type": "/organization/organization", "also:type": "/business/business_operation", "name": null, "/business/business_operation/industry": "Manufacturing", "headquarters": [ {"citytown": { "type": "/location/location", "containedby": [ {"name": "China" }]}}]}]雖然複雜,但是改改參數就可以做各種變化,而維基 API 能查到的東西就與有沒有某個分類有很大的關係,MQL 的詳細說明請參考[2]。這些資料,雖然理論上都可以從各個公有地方找到,但是實際上 Freebase 跟維基都是由人力辛苦建立起來的資料庫,透過一筆一筆資料輸入進去,所以也等於是使用別人歸納的結果,而中文相關的資料不夠也是跟使用維基跟 Freebase 的中文朋友不夠有直接的關係。語意網是一個所有網站都主動放置元數據,靠網路蜘蛛就可以自動化建立這些資料庫的美好的社會理論。但是實際上每個做網頁的都懶,加上一些社會原因使得這個理想到目前為止還差很遠。靠自然語言處理建立這樣的資料庫似乎還不是很有希望的事。總之,這些是扯遠了。[1]mediawiki.org/wiki...[2]freebase.com/docs...

相关热词搜索:

上一篇:知乎有不少伪问题,知乎应该如何处理?
下一篇:Tumblr 改版的目的是什么?利弊有哪些?