Find Datasets for Your Project
Dataset Increasing...
Awesome Public Datasets
這個公共數據源列表是從博客,答案和用戶響應中收集和整理的。 下面列出的大部分數據都是免費的,但有些則不是。 它包含了太多的數據集,各種領域如農業、健康、地理、軟件、運動等等。
Stanford Large Network Dataset Collection
這是Stanford大學創建的一個關於社會網絡的數據集收集倉庫,包含大量的與社交網絡有關的數據集。如Twitter、Facebook等用戶及其社交關系。
The Yahoo Webscope Program
雅虎Webscope計劃是由學者和其他科學家為非商業用途的有趣和科學有用的數據庫的參考庫。 所有的數據集已經過審查,以符合雅虎的數據保護標準,包括嚴格的隱私控制。 我們有很多數據集,我們很高興與您分享。 雅虎很高興將這些數據集提供給正在推動網絡科學知識和理解狀態的研究人員。 數據集僅適用於同意數據共享協議的教授和大學研究人員的學術使用。包括廣告和營銷數據、計算機系統數據、競賽數據等。
UC Irvine Machine Learning Repository
我們目前維護295個數據集作為機器學習社區的服務。 您可以通過我們的可搜索界面查看所有數據集。 我們的舊網站仍然可用,對於那些喜歡舊格式的用戶。 有關存儲庫的一般概述,請訪問我們的關於頁面。 有關在出版物中引用數據集的信息,請閱讀我們的引文政策。 如果您希望捐贈數據,請參閱我們的捐贈政策。 對於任何其他問題,請隨時聯系知識庫館員。 我們還為Repository建立了一個鏡像站點。
Yelp評論數據集
這是Yelp官方發布的最新的關於商戶評論的數據集,包含商家信息、評論信息和用戶數據,以及簽到信息,提供JSON和SQL兩種格式。有470萬的評論,15萬6000加商戶信息,20萬的圖片信息,12個城市地區。
myPersonality Project
myPersonality是一個流行的Facebook應用程序,允許用戶進行真正的心理測試,並且記錄(在同意的情況下)他們的心理和Facebook個人資料。目前,我們的數據庫包含超過600萬個測試結果,以及超過400萬個人Facebook個人資料。我們的受訪者來自不同年齡段,背景和文化。他們非常願意誠實和謹慎地回答,因為他們參與的唯一的滿足是他們對結果的反饋。在這裏,我們向註冊的合作者提供了各種各樣的數據,包括:心理測試測驗的得分,用戶的Facebook個人資料的記錄,測試項目的水平數據,以及一些額外的信息。用戶喜歡的記錄。您將在“下載數據庫”部分找到有關可用數據的更多詳細信息。為了讓您的生活更輕松,我們預處理大部分數據。我們計算分數,重新編碼變量,刪除無效記錄,匿名結果等。請註意,並非所有已記錄(或潛在可記錄)的變量當前都可用(讓我們知道是否需要添加某些內容)。
世界最大的社會科學文獻網站
ICPSR確保受訪者在公共使用版本的數據集內保密。 絕大多數ICPSR數據是公用文件,沒有訪問限制。 有時采取保護措施降低披露風險將大大降低數據的研究潛力。 在這些情況下,ICPSR通過對訪問它們的嚴格要求提供對保留機密數據的受限使用版本的訪問。