首页 > 教育学习 > 为什么 > 如何获得一些比较全的公有数据？

如何获得一些比较全的公有数据？
2012-01-19 19:52:41 来源：点击：

工作

1 个答案

答案 1：
先具體的回答如何得到「某个行业的企业的名单」：
例：zh.wikipedia.org/w/api...中國製造公司&cmlimit=500&format=json （中國製造公司的名單）例：en.wikipedia.org/w/api... （中國的互聯網公司，雖然是英文的）詳細請參考[1]
例：https://api.freebase.com/api/servic...{%22query%22:[{%22type%22:%22/organization/organization%22,%22also:type%22:%22/business/business_operation%22,%22name%22:null,%22/business/business_operation/industry%22:%22Manufacturing%22,%22headquarters%22:[{%22citytown%22:{%22type%22:%22/location/location%22,%22containedby%22:[{%22name%22:%22China%22}]}}]}]} （中國製造公司）它或了一個叫做 MQL 的頗為複雜的查找語言，上面用到的 MQL 是：[{"type": "/organization/organization", "also:type": "/business/business_operation", "name": null, "/business/business_operation/industry": "Manufacturing", "headquarters": [ {"citytown": { "type": "/location/location", "containedby": [ {"name": "China" }]}}]}]雖然複雜，但是改改參數就可以做各種變化，而維基 API 能查到的東西就與有沒有某個分類有很大的關係，MQL 的詳細說明請參考[2]。這些資料，雖然理論上都可以從各個公有地方找到，但是實際上 Freebase 跟維基都是由人力辛苦建立起來的資料庫，透過一筆一筆資料輸入進去，所以也等於是使用別人歸納的結果，而中文相關的資料不夠也是跟使用維基跟 Freebase 的中文朋友不夠有直接的關係。語意網是一個所有網站都主動放置元數據，靠網路蜘蛛就可以自動化建立這些資料庫的美好的社會理論。但是實際上每個做網頁的都懶，加上一些社會原因使得這個理想到目前為止還差很遠。靠自然語言處理建立這樣的資料庫似乎還不是很有希望的事。總之，這些是扯遠了。[1]mediawiki.org/wiki...[2]freebase.com/docs...

QQ空间新浪微博腾讯微博人人网更多

如何获得一些比较全的公有数据？
2012-01-19 19:52:41 来源：点击：

1 个答案

热门知识

教育学习 > 为什么 > 热点知识

本月热门知识

如何获得一些比较全的公有数据？ 2012-01-19 19:52:41 来源： 点击：

1 个答案

热门知识

教育学习 > 为什么 > 热点知识

本月热门知识

如何获得一些比较全的公有数据？
2012-01-19 19:52:41 来源：点击：