ورود به حساب کاربری

نام کاربری *
رمز عبور *
یاداوری

"این صفحه در حال به روز رسانی است"

شرکت دانش بنیان رایانش سریع هزاره ایرانیان در راستای فعالیت در حوزه بیگ دیتا (کلان داده)، اقدام به جمع آوری دیتاست های مورد نیاز پژوهشگران در حوزه های گوناگون نموده است. این مجموعه داده ها از سایت ها و منابع معتبر جمع آوری و دسته بندی شده است.

توضیحات مختصری از هر دیتاست به همراه جدول اطلاعات ، جدول دانلود و منابع مرتبط به آن آماده سازی شده که با کلیک بر روی نام هر دیتاست قابل دسترسی است.

به منظور سهولت جستجو، در طول تکمیل این مجموعه بزرگ، دیتاستهای مرتبط به موضوعات گوناگون در قالب منوهای مختلف و در هر منو، جدول مجزا ارائه خواهد شد.

مجموعه بزرگ دیتاست ها

عنوان توضیحات حجم کل
wikispeedia مسیرهای Navigation در شبکه لینک های ویکی پدیا 797.8 MB
wiki-Vote شبکه who-votes-on-whom ویکی پدیا 283.5 KB
wiki-Talk شبکه گفتگو (ارتباطات) ویکی پدیا 16.2 MB
wiki-Elec اطلاعات انتخابات مدیر ویکیپدیا 1 MB
wiki-RfA درخواست ویکی پدیا برای مدیر (با متن) 14.3 MB
wiki-meta تاریخچه ویرایش کامل ویکی پدیا (چه شخصی چه صفحه ای را ویرایش کرده) 30.7 GB
wiki-hoaxes کلاهبرداری از ویکی پدیا 1 MB
عنوان توضیحات حجم کل
as-733 733 نمونه روزانه (نمودار) از 8 نوامبر 1997 تا 2 ژانویه 2000 37.5 MB
as-Skitter نمودار توپولوژي اينترنتي از traceroute هاي اجرایی روزانه در سال 2005 31.7 MB
as-Caida مجموعه داده های ارتباطات CAIDA AS از ژانویه 2004 تا نوامبر 2007 44.7 MB
Oregon-1 اطلاعات بدست آمده ازنمایشهای مسیر ایالت اورگن بین 31 مارس و 26 می 2001 619 KB
Oregon-2 اطلاعات بدست آمده ازنمایشهای مسیر ایالت اورگن بین 31 مارس و 26 می 2001 853 KB
عنوان توضیحات حجم کل
ego-Facebook حلقه های اجتماعی از فیس بوک (ناشناس) 929 KB
ego-Gplus حلقه های اجتماعی از +google 774 MB
ego-Twitter حلقه های اجتماعی از Twitter 21.4 MB
soc-Epinions1 چه کسی اعتماد دارد - کدام شبکه Epinions.com 1.6 MB
soc-LiveJournal1 شبکه اجتماعی آنلاین LiveJournal 247.6 MB
soc-Pokec شبکه اجتماعی آنلاین Pokec 541.7 MB
soc-Slashdot0811 شبکه اجتماعی Slashdot از نوامبر 2008 3 MB
soc-Slashdot0922 شبکه اجتماعی Slashdot از فوریه 2009 3.1 MB
wiki-Vote ویکی پدیا شبکه who-votes-on-whom 283.5 MB
wiki-RfA درخواست های ویکی پدیا برای اداره امور (با متن) 14.3 MB
bitcoin-otc وب سایت Bitcoin OTC از شبکه اعتماد 388 KB
bitcoin-alpha وب سایت Bitcoin Alpha از شبکه اعتماد 146 KB
عنوان توضیحات حجم کل
loc-Gowalla شبکه های اجتماعی آنلاین مبتنی بر مکان Gowalla 106.6 MB
loc-Brightkite شبکه های اجتماعی آنلاین مبتنی بر مکان Brightkite 58.5 MB
عنوان توضیحات حجم کل
sx-stackoverflow نظرات، سؤالات و پاسخ ها در مورد Stack Overflow 1015 MB
sx-mathoverflow نظرات، سؤالات و پاسخ ها در مورد Math Overflow 6.9 MB
sx-superuser نظرات، سؤالات و پاسخ ها در مورد Super User 21.5 MB
sx-askubuntu نظرات، سؤالات و پاسخ ها در مورد Ask Ubuntu 14.1 MB
wiki-talk-temporal Users editing talk pages on Wikipedia 56.2 MB
email-Eu-core-temporal ایمیل های بین کاربران در یک موسسه تحقیقاتی 2.3 MB
CollegeMsg پیام ها بر روی یک پلت فرم مانند فیس بوک در UC-Irvine 337.2 KB
bitcoin-otc وب شبکه اعتماد Bitcoin OTC 388 KB
bitcoin-alpha Bitcoin Alpha web of trust network 146 KB
عنوان توضیحات حجم کل
p2p-Gnutella04 شبکه نظیر به نظیر Gnutella از 4 اوت 2002 127 KB
p2p-Gnutella05 شبکه نظیر به نظیر Gnutella از 5 اوت 2002 99 KB
p2p-Gnutella06 شبکه نظیر به نظیر Gnutella از 6 اوت 2002 98 KB
p2p-Gnutella08 شبکه نظیر به نظیر Gnutella از 8 اوت 2002 62 KB
p2p-Gnutella09 شبکه نظیر به نظیر Gnutella از 9 اوت 2002 79 KB
p2p-Gnutella24 شبکه نظیر به نظیر Gnutella از 24 اوت 2002 215 KB
p2p-Gnutella25 شبکه نظیر به نظیر Gnutella از 25 اوت 2002 177 KB
p2p-Gnutella30 شبکه نظیر به نظیر Gnutella از 30 اوت 2002 290 KB
p2p-Gnutella31 شبکه نظیر به نظیر Gnutella از 31 اوت 2002 499 KB
عنوان توضیحات حجم کل
bitcoin-otc وب سایت Bitcoin OTC از شبکه اعتماد 388 KB
bitcoin-alpha وب سایت Bitcoin Alpha از شبکه اعتماد 146 KB
soc-sign-epinions Epinions شبکه اجتماعی علامت دار 208 MB
wiki-Elec اطلاعات انتخابات مدیر ویکیپدیا 1 MB
wiki-RfA درخواست ویکی پدیا برای مدیر (با متن) 14 MB
soc-sign-Slashdot081106 شبکه اجتماعی علامت دار Slashdot Zoo از 6 نوامبر 2008 1.7 MB
soc-sign-Slashdot090216 شبکه اجتماعی علامت دار Slashdot Zoo از 16 فوریه 2009 1.8 MB
soc-sign-Slashdot090221 شبکه اجتماعی علامت دار Slashdot Zoo از 21 فوریه 2009 1.8 MB
عنوان توضیحات حجم کل
com-LiveJournal شبکه اجتماعی آنلاین LiveJournal 140 MB
com-Friendster        حلقه های اجتماعی آنلاین Friendster        8.8 GB
com-Orkut حلقه های اجتماعی آنلاین Orkut 759 MB
com-Youtube حلقه های اجتماعی آنلاین Youtube 10.5 MB
com-DBLP شبکه همکاری DBLP 5.9 MB
com-Amazon شبکه محصول آمازون 9.7 MB
email-Eu-core شبکه ایمیل 80.6 KB
wiki-topcats هایپرلینک های ویکی پدیا 15 MB
عنوان توضیحات حجم کل
amazon0302 شبکه خریداری محصول آمازون از 2 مارس 2003 4.4 MB
amazon0312 شبکه خریداری محصول آمازون از 12 مارس 2003 11 MB
amazon050 شبکه خریداری محصول آمازون از 5 مه 2003 11 MB
amazon0601 شبکه خریداری محصول آمازون از 1 ژوئن 2003 11 MB
amazon-meta ابرداده محصول آمازون: اطلاعات محصول و تمامی بررسیها در مورد محصولات 548،552 201 MB
عنوان توضیحات حجم کل
ca-AstroPh شبکه همکاری از آرشیو اخترفیزیک (Astrophysics) 1.4 MB
ca-CondMat شبکه همکاری از آرشیو ماده چگال(Condensed Matter) 710 KB
ca-GrQc شبکه همکاری از آرشیو نسبیت عام(General Relativity) 107 KB
ca-HepPh شبکه همکاری از آرشیو فیزیک انرژی‌های بالا(High Energy Physics) 796 KB
ca-HepTh شبکه همکاری از آرشیو نظریه فیزیک انرژی‌های بالا 11.6 MB
عنوان توضیحات حجم کل
twitter7 مجموعه ای از 476 میلیون توییت جمع آوری شده از ژوئن تا دسامبر 2009 -
memetracker9 عبارات Memetracker و لینک ها بین 96 میلیون پست های وبلاگ از اوت 2008 تا آوریل 2009 13.3 GB
ksc-time-series سری زمانی از حجم 1000 عبارات محبوب Memetracker و 1000 هشتگ محبوب توئیتر 2.4 MB
higgs-twitter Spreading processes of the announcement of the discovery of a new particle with the features of the Higgs boson on 4th July 2012. 58.9 MB
عنوان توضیحات حجم کل
web-BerkStan نمودار وب Berkeley و Stanford 19 MB
web-Google نمودار وب از Google 20 MB
web-NotreDame نمودار وب سایت نتردام 12 MB
web-Stanford نمودار وب سایت Stanford.edu 8.5 MB
عنوان توضیحات حجم کل
cit-HepPh شبکه ارجاع مقالات فیزیک انرژی بالا Arxiv 1.7 MB
cit-HepTh شبکه ارجاع مقالات فیزیک انرژی بالا Arxiv 12.4 MB
cit-Patents شبکه استناد در میان اختراعات ایالات متحده 81.5 MB
عنوان توضیحات حجم کل
email-EuAll شبکه ایمیل از موسسه پژوهشی اتحادیه اروپا 1.5 MB
email-Enron شبکه ارتباطات ایمیل از Enron 1 MB
wiki-Talk شبکه گفتگوی (ارتباطات) ویکی پدیا 16 MB
عنوان توضیحات حجم کل
RedditPizzaRequests درخواست متنی برای Pizza با برچسب های نتیجه 2.63 MB
Reddit محتوای ارسال مجدد در reddit.com 1.81 GB
flickr Images sharing common metadata on Flickr 1.46 GB
عنوان توضیحات حجم کل
roadNet-CA شبکه جاده ای کالیفرنیا 17 MB
roadNet-PA شبکه جاده ای پنسیلوانیا 9.5 MB
roadNet-TX شبکه جاده ای تگزاس 12 MB
عنوان توضیحات حجم کل
Fine Foods بررسی مواد غذایی از آمازون 116 MB
Movies نقد و بررسی فیلم از آمازون 3.1 GB
----------------------------- "دیتاست یادگیری ماشین (Machine Learning)" -----------------------------

شرکت دانش بنیان رایانش سریع هزاره ایرانیان به منظور طراحی، ساخت و گسترش کاربردهای رایانش سریع در علوم مختلف پایه گذاری شده است. این شرکت به دنبال ایجاد بستری با ظرفیت محاسباتی و ذخیره سازی بالا مبتنی بر CPU و GPU می باشد تا بتواند از آن طریق سرویسهای متعددی را به محققین، اساتید، دانشجویان تحصیلات تکمیلی و سایر علاقه مندان این حوزه ارائه نماید.

 

سایت مرتبط : " بنیاد توسعه رایانش سریع و ابری "

 

 

آخرین مقالات

کامپایل و نصب mfix-2016.1

درک عملکرد دستگاه های انرژی، محیط زیست و فرایندها...

ماشین هوشمند بدون کمک انس...

یک ماشین هوشمند با حل معمای مکعب روبیک بدون هیچ آم...

معرفی lammps

اصطلاح شناسی شبیه ساز: فراهم کننده ی بستری برای شب...

آموزش نرم افزار amber (زب...

در اینجا تعدادی از آموزش های آماده شده توسط توسعه...

HPC Moves to the Cloud –...

While some domains that rely on computing systems...

یکسان سازی یا نرمال سازی...

در متن کاوی منظور از پردازش زبان طبیعی (NLP)، قابل...

پردازش متن با Jhazm نسخه...

jHazm نسخه جاوایی هضم از کتابخانه پایتون برای پردا...

Why Demand for In-Memory...

The demand for in-memory computing (IMC) and new...

آموزش عملی گراف کاوی و تح...

networkx یک بسته پایتون برای ایجاد، دستکاری و مطا...

معرفی مختصر مدل اقلیمی CW...

CWRF نسخه توسعه یافته اقلیمی مدل WRF می باشد که د...

بالاخره بعد از سالها یکه...

از سال 2013، ماشین های چینی در رتبه قدرتمندترین اب...

کاربردها و خطرات کلان داد...

داده شامل اطلاعات است؛ اما این همه‌ي ماجرا نیست....

Case Study: Supercomputin...

Hyperion Research has published a new case study...

داده کاوی بزرگ مقرون به ص...

چکیده : کاوش داده ی بزرگ، اغلب نیازمند منابع محاس...

Python: Unlocking the Pow...

The programming language Python is being used to...

Opportunities Abound: HPC...

The is the first entry in a five-part insideHPC s...

آموزش کد محاسباتی سیستا (...

در این آموزش سعی داریم انرژی کل و طول پیوند مولکو...

درمورد مدل‌های آب و هوایی...

دو اصطلاح اقلیم‌شناسی و هوا‌شناسی بیشتر مواقع به‌ج...

الگوریتم تجزیه بندرز خودک...

در نسخه‌ی ۱۲٫۷ نرم‌افزار CPLEX رویه‌ی جدیدی جایگز...

نرم افزار tecplot

معرفی : Tecplot در واقع یک ابزار تجسمی و رسم نمودا...

تجزیه گر یا پارسر متون و...

آپاچی تیکا: آپاچی تیکا یکی از پروژه‌های متن باز A...

OpenFOAM v5 User Guide: I...

This guide accompanies the release of version 5.0...

OpenFOAM User Guide - Ver...

Introduction The OpenFOAM User Guide provides an...

How to Prepare Weather an...

In this video from the NVIDIA GPU Technology Conf...

مثالی از داده کاوی و تحلی...

در این پست یک تحلیل و بصری سازی خوب از گراف ۶۰،۰۰...

نرم افزار سیپلکس

معرفی : Cpelx یک بسته ی نرم افزاری شامل مجموعه ای...

تلاش AMD برای ساخت تراشه‌...

ریسک‌های کمی در دنیای فناوری به بزرگی خرج میلیارده...

معرفی، آموزش و لینک دانلو...

معرفی : ابزاری به منظور آنالیز فنی و طراحی کامپیوت...

Neurala Reduces Training...

Today Neurala announced a breakthrough update to...

با 10 باور نادرست در ارتب...

برای آنکه اطمینان حاصل کنید برنامه‌های سازمان شما...

گالری تصاویر