ورود به حساب کاربری

نام کاربری *
رمز عبور *
یاداوری

کاربردها و خطرات کلان داده چیست؟

امتیاز کاربران

ستاره غیر فعالستاره غیر فعالستاره غیر فعالستاره غیر فعالستاره غیر فعال
 
 
 
 

داده شامل اطلاعات است؛ اما این همه‌ي ماجرا نیست. جزئیات یک حادثه یا اخباری درباره‌ی سلامت انسان داده‌ای نیست که ما با آن سروکار داشته باشیم. وقتی ما از داده صحبت می‌کنیم درواقع منظورمان مجموعه‌ی داده، سازمان‌دهی و ذخیره‌سازی آن است.

 

در عصر اینترنت شرکت‌ها و سازمان‌ها در سراسر جهان داده‌های بسیاری جمع‌آوری کرده‌اند که در ادامه به مقیاس گسترده‌ی آن‌ها می‌پردازیم. اکنون که کلان داده‌ وجود دارد تاثیر بسیار بزرگی بر زندگی ما می‌گذارد.

 

کلان داده چیست؟

کلان داده‌ مجموعه‌ی بسیار بزرگی از داده‌ها است که ابزارهای سنتی ما برای مدیریت این اطلاعات به کار نمی‌آیند. کلان داده‌ می‌تواند اشکال مختلفی داشته باشد.

 

نمونه‌هایی از کلان داده:

  • توییت‌های ذخیره‌شده در سرورهای توییتر
  • اطلاعاتی که گوگل از ردیابی خودروهای سواری به‌دست می‌آورد
  • مجموعه‌ای کامل از نتایج انتخابات محلی و ملی کشور که ابتدایی‌ترین رکوردها را نیز در بر دارد
  • اطلاعات شرکت‌های بیمه درمانی درباره‌ی افرادی که تحت درمان قرار می‌گیرند، نوع معالجات آن‌ها و بیمارستان مورد نظر دارند
  • اطلاعات لیست خریدها و مکان‌های ثبت شده در کارت‌های اعتباری
  • اطلاعات زمان، مکان و مدت زمان فیلم‌هایی که افراد در نت‌فلیکس تماشا می‌کنند

 

فناوری کلان داده چیست؟

رایانه‌های شخصی ما بطور کلی توانایی مدیریت حجم کمی از داده‌ها را دارند. کل اطلاعاتی را که می‌توانید وارد یک کامپیوتر کنید، در نظر بگیرید؛ در عین حال نرم‌افزارهای پایگاه‌داده قابلیت مدیریت حجم‌های بزرگتری از اطلاعات را دارند. این ابزارها می‌توانند روی داده‌های یک درایو سخت قرار بگیرند؛ البته ممکن است به قفسه‌هایی شامل نوت‌بوک‌ها و پوشه‌ها نیاز داشته باشند. اما این ابزارها برای رسیدگی به کل حجم اطلاعاتی که ما به‌عنوان کلان داده به آن‌ها اشاره می‌کنیم کافی نیستند. به همین خاطر روش‌های جدیدی توسعه یافته‌اند.

 

محاسبات ابری کارها را از کامپیوترهای ما روی سرورهای راه دور تخلیه می‌کند. به همین دلیل روش‌های زیادی برای دسترسی و استفاده از اطلاعات وجود دارد.

 

کاربردهای جالب توجه کلان داده

کلان داده به خودیِ خود به وجود نیامده؛ چندین روند، علت وجود آن را تقویت کرده‌اند.

 

اینترنت اشیاء

اینترنتی که شما در حال حاضر می‌شناسید اینترنت افراد است، جایی که در آن مردم از طریق ماشین‌هایی تسهیل‌کننده با یکدیگر ارتباط برقرار می‌کنند. به عنوان نمونه‌‌ای از این تعاملات، تصور کنید شما سایتی که دیگران طراحی کرده‌اند را بازدید می‌کنید و یا متنی که دیگران در سایت تایپ کرده‌اند می‌خوانید.اینترنت اشیاء جایی است که در آن اشیاء بدون دخالت بشر مستقیما با یکدیگر ارتباط برقرار می‌کنند؛ مثلا یک دستگاهی که بر آب‌و‌هوا نظارت می‌کند در نظر بگیرید؛ ترموستاتی هوشمند به این اطلاعات دسترسی پیدا می‌کند و درجه حرارت منزل شما را تنظیم می‌کند.

 

کلان داده و اینترنت اشیاء کاملا به یکدیگر وابسته‌اند. سازمان‌ها باید بدانند با حجم انبوهی از اطلاعاتی که جمع‌آوری می‌شود، چه‌کاری باید انجام دهند. اشیاء از طریق اینترنت و به لطف داده‌هایی که در دسترس‌شان است می‌توانند خودشان اقداماتی را صورت بدهند. هرچه دستگاه‌های بیشتری به این روش عمل می‌کنند داده‌های بیشتری تولید می‌شود.

 

یادگیری ماشین

منظور از یادگیری ماشین در واقع توانایی یادگیری کامپیوتر بر مبنای داده‌ها است؛ همین توانایی اساس شکل‌گیری وضعیت‌های مختلف رادیو اینترنتی پاندورا به سَبک مخصوص شما است. همچنین یادگیری ماشین در پشت پرده‌ی پیشنهادات محتوای یوتیوب و نت‌فلیکس قرار دارد.

 

این پیش‌بینی‌ها مبتنی بر الگوریتم‌ها هستند. الگوریتم جستجوی گوگل و نیز الگوریتمی که تعیین می‌کند چه چیزی در فید خبری فیسبوک مشاهده کرده‌اید همگی مبتنی بر توانایی یادگیری ماشین هستند.

 

 

 اما این‌ها بخش کوچکی از چگونگی تاثیر یادگیری ماشین بر زندگی روزمره‌ی ما هستند.

 

هوش مصنوعی

هوش مصنوعی گام بعدی پس از یادگیری ماشین است. در هوش مصنوعی نه تنها یادگیری کامپیوتر باز داده‌ها وجود دارد، بلکه کامپیوتر از این اطلاعات در راستای تصمیم‌گیری متکی به خود و شکل‌دهی رفتار خودش استفاده می‌کند. مایکروسافت و گوگل نمونه‌هایی از تلاش برای ساخت ربات‌های انسانی هستند؛ فیسبوک نیز هوش مصنوعی را برای کمک به جلوگیری از خودکشی به کار گرفته است. فناوری به سرعت در حال پیشرفت است، تا جایی که نمونه‌های متعددی وجود دارد که "تفکر کردنِ کامپیوتر" بهتر از نوع بشریِ آن عمل می‌کند.

 

علم تجزیه و تحلیل کلان داده چیست؟

منابع کلان داده به خودی خود هیچ‌گونه اطلاعاتی را در اختیار ما نمی‌گذارند، در واقع شخصی باید باشد که مفهوم این اطلاعات را دریابد. در واقع کل کاری که در تجزیه و تحلیل کلان داده باید انجام شود به این صورت است: بررسی حجم زیادی از اطلاعات غیر قابل فهم و سپس فهمیدن آن‌چه می‌توان از آن استخراج کرد.

شرکت‌ها در زمینه‌های مختلف برای ارائه روش‌های تحلیل مخصوص خودشان در حوزه کلان‌ داده‌ها با یکدیگر رقابت می‌کنند

و به همین ترتیب کلان داده‌ها روی زندگی شما تاثیر می‌گذارند، حتی اگر یک مخالف تکنولوژی دنیای مدرن باشید. اما چرا به کلان داده‌ها روی آورده‌ایم؟ به این علت که با بینش صحیح، کلان داده‌ها مزایای زیادی دارند.

 

کاربردهای کلان داده

کلان داده همواره در جهت بهبود روند زندگی کاربرد زیادی داشته است؛ در این بخش برخی از موارد کاربرد کلان داده را بررسی خواهیم کرد:

 

کلان داده در خدمات بهداشتی، درمانی و سلامت

صنعت بیمه سلامت در زمینه اقتباس تکنولوژی‌های جدید سرعت خوبی ندارد. برخی از ارائه‌دهندگان بیمه‌های بهداشتی، درمانی و سلامت در حال مهاجرت از کاغذ به ابزارهای ذخیره‌سازی دیجیتالی هستند. با این وجود کلان داده در برخی زمینه‌ها تفاوت‌هایی را ایجاد کرده است؛ یکی از این زمینه‌ها یکپارچگی داده‌ها است. بیمه‌گذاران و ارائه‌‌دهندگان در حال کار روی ترکیب داده‌های منابع مختلف هستند، داده‌هایی مانند مانند مطالبات، اشعه ایکس، یادداشت‌ها و نسخه‌های پزشکان.

 

 

بسیاری معتقدند که اگر داده‌های بیمه سلامت بهتر یکپارچه‌سازی می‌شدند می‌توانستند بیمه‌ی بهتری با هزینه‌ای کمتر ارائه بدهند. در حالی که آمازون، برکشایر هاتاوی و جان پیرپونت مورگان اوایل سال جاری اعلام کردند در زمینه بیمه سلامت با یکدیگر همکاری می‌کنند، تکنولوژی را به عنوان نقطه تمرکز خود (مانند صفحه اصلی روزنامه گاردیَن) اعلام کردند.

 

کلان داده در بانکداری و خدمات مالی

صنعت مالی کاملا مصرّ بر تصمیم‌گیری‌های مبتنی بر تحلیل‌های کامپیوتری است. سقوط آنی سهام وال استریت به علت معاملات خودکار از طریق ماشین‌هایی بود که بدون دخالت انسان سهام را به سرعت با قیمتی پایین‌تر می‌فروختند و با توجه به آنچه در بازار درحال رخ دادن بود سایر فروشندگان را وادار به فروش کرده و نسبت به فروش تحریک می‌کردند. این نوع تجارت، تجارت بسامد بالا نامیده می‌شود.

 

اکنون دانشمندانِ داده‌های مالی، با استفاده از کلان‌ داده‌ها پیش‌‌بینی می‌کنند که کدام سهام موفق خواهد بود و کدام یک احتمال دارد سقوط کند. همچنین بانک‌ها هم به کلان داده‌ها به عنوان راهی برای افزایش درآمد نگاه می‌کنند.

 

 

کلان داده در تجارت الکترونیکی و بازاریابی

بازاریابی مدرن به داده‌ها وابستگی شدیدی دارد و ما هم با هر خریدی که انجام می‌دهیم اطلاعات زیادی تولید می‌کنیم. در این رابطه کلان داده‌ وعده‌های بسیاری به حوزه‌ی بازاریابی داده است که اصلی ترین آن‌ها پاسخ به دو نیاز اصلی است.

 

اول به کمک آن‌ها می‌توان درباره شخص خریدار، زمان، مکان، نوع و قیمت خرید اطلاعات کسب کرد؛ و مورد دوم به دست آوردن ارتباطی منطقی بین محصولاتی که مشتریان می‌بینند یا در موردشان می‌خوانند یا می‌شنوند و در نهایت چیزی که خریداری می‌کنند. برخی فروشگاه‌ها با ردیابی کارت‌های اعتباری و وفاداری مشتریان از طریق دوربین یا ردیابی تلفن‌شان می‌فهمند کدام بخش از فروشگاه بیشتر توجه آن‌ها را جلب کرده است. مشتریان قبل از خرید باید به صورت آنلاین حساب‌هایی ایجاد کنند که این کار به سایت‌ها اجازه می‌دهد نه تنها خرید‌های آن‌ها بلکه هر قلمی که آن‌ها مشاهده می‌کنند را نیز ردیابی کنند.

 

در عوض تکنیک‌هایی مثل هدف‌گیری و شناسایی مشتری که نیمی از بودجه‌ی بازاریابی را هدر می‌دهند و تنها برای کوتاه‌مدت اثربخش هستند، پاسخ به این دو نیاز بسیار اثربخش‌تر است.

 

برای پاسخ به این نیاز‌ها، بازاریاب‌ها باید با استفاده از کلان داده از طریق تشخیص الگوی مصرف مشتری و شناخت علاقمندی‌ها و عادات مصرف، خرید بعدی وی را پیش‌بینی کنند

در واقع فروشگاه‌ها طرح‌های خود را بر مبنای علاقه و رفتار مشتریان پایه‌گذاری می‌کنند تا شرایط همکاری بهتری را در تجارت پیدا کنند. فروشندگان آنلاین بر مبنای اطلاعات جمعیت‌شناختی و سایر معیارها درباره‌ی چیزی که ما می‌خواهیم ببینیم تصمیم می‌گیرند. فروشگاه‌های جدید غیر مجازی آمازون نمونه‌ای از ادغام دو دنیا هستند.

 

نیاز‌های بزرگی وجود دارند که از طریق نظارت بر علایق و رفتار آنلاین ما بوجود می‌آیند. گوگل و فیسبوک غول‌های سودآور تکنولوژی هستند که دلیل آن توانایی آن‌ها در فروش تبلیغات است که نسبت به پلت‌فرم‌ها و روش‌های تبلیغاتی دیگر بهتر می‌توانند گروه مصرف‌کنندگان به خصوص را مورد هدف قرار بدهند؛ این قابلیت آن‌ها به لطف اطلاعاتی است که برای استفاده از سرویس‌های آن‌ها ارائه می‌کنیم.

 

آیا کلان داده خطرناک است؟

همانطور که کلان داده با وعده‌هایی همراه است ریسک‌هایی نیز دارد؛

 

نگران‌کننده‌ترین مسئله حال حاضر، حریم خصوصی و امنیت اطلاعات است

کاهش حریم خصوصی از جمله معایب بزرگ کلان داده است؛ اکثریت مردم بیشتر از هر زمان دیگری در تاریخچه‌ی بشری درباره‌ی ما اطلاعات دارند. نه تنها پیدا کردن محل زندگی ما، بلکه دانستن در مورد جایی که می‌رویم، شخصی را که دوست داریم، نحوه‌ی زندگی ما، و تفکرات ما نیز آسان است. این موضوع باعث می‌شود که مسائل شخصی و اجتماعی بیشتر در معرض دستکاری قرار بگیرند. ممکن است ما فریب بخوریم و رمز و شماره کارت اعتباری خود را از دست بد‌هیم یا تحت تاثیر قرار بگیریم تا به کاندیداهایی رای بدهیم که تمایلی به حمایت از آن‌ها نداریم. داده‌های بیشتر راه‌های بیشتری برای تبلیغ‌کنندگان و شرکت‌های رسانه‌ای فراهم می‌کند تا میل‌ها و ارزش‌های ما را شکل دهند. نسبت به گذشته اطلاعات و داده‌های بیشتری درباره‌ی ما وجود دارد و این داده‌ها در مکان‌های بیشتری نگه‌داری می‌شوند و این مسئله باعث می‌شود اهداف بیشتری در معرض حمله قرار بگیرند. در حال حاضر سرقت داده‌های ما به صورت غیر قابل کنترل و بی وقفه رخ می‌دهد. حتی شرکت‌هایی که روند درستی برای حفاظت از داده‌های ما در مقابل حملات خارجی دارند اغلب خودشان فعالیت‌های مشکوکی روی داده‌های ما انجام می‌دهند، همانند چیزی که در فیسبوک شاهد بودیم. مسئله‌ی ریسک بعدی پیش‌بینی‌هایی است که افراد از طریق اطلاعات کلان داده انجام می‌دهند. مثلا آیا برای بیمه‌ی سلامتی افرادی که عادت‌های غذایی ناسالم دارند بیشتر هزینه کنیم؟ آیا باید امنیت و ارامش را در مناطقی که پیش‌بینی می‌کنیم افزایش بدهیم؟ آیا قیمت برای خریداران آنلاین که در مناطق فقیر زندگی می‌کنند افزایش می‌یابد؟

 

یافتن راه‌هایی برای حفاظت از داده‌، احترام به حریم خصوصی‌ و حفظ ارزش‌هایمان به صورت چالش‌هایی مداوم با روندی در جهت کلان داده‌ها ادامه خواهد داشت.

 

------------------------------------------

منبع : زومیت

شرکت دانش بنیان رایانش سریع هزاره ایرانیان به منظور طراحی، ساخت و گسترش کاربردهای رایانش سریع در علوم مختلف پایه گذاری شده است. این شرکت به دنبال ایجاد بستری با ظرفیت محاسباتی و ذخیره سازی بالا مبتنی بر CPU و GPU می باشد تا بتواند از آن طریق سرویسهای متعددی را به محققین، اساتید، دانشجویان تحصیلات تکمیلی و سایر علاقه مندان این حوزه ارائه نماید.

 

سایت مرتبط : " بنیاد توسعه رایانش سریع و ابری "

 

 

آخرین مقالات

کامپایل و نصب mfix-2016.1

درک عملکرد دستگاه های انرژی، محیط زیست و فرایندها...

ماشین هوشمند بدون کمک انس...

یک ماشین هوشمند با حل معمای مکعب روبیک بدون هیچ آم...

معرفی lammps

اصطلاح شناسی شبیه ساز: فراهم کننده ی بستری برای شب...

آموزش نرم افزار amber (زب...

در اینجا تعدادی از آموزش های آماده شده توسط توسعه...

HPC Moves to the Cloud –...

While some domains that rely on computing systems...

یکسان سازی یا نرمال سازی...

در متن کاوی منظور از پردازش زبان طبیعی (NLP)، قابل...

پردازش متن با Jhazm نسخه...

jHazm نسخه جاوایی هضم از کتابخانه پایتون برای پردا...

Why Demand for In-Memory...

The demand for in-memory computing (IMC) and new...

آموزش عملی گراف کاوی و تح...

networkx یک بسته پایتون برای ایجاد، دستکاری و مطا...

معرفی مختصر مدل اقلیمی CW...

CWRF نسخه توسعه یافته اقلیمی مدل WRF می باشد که د...

بالاخره بعد از سالها یکه...

از سال 2013، ماشین های چینی در رتبه قدرتمندترین اب...

کاربردها و خطرات کلان داد...

داده شامل اطلاعات است؛ اما این همه‌ي ماجرا نیست....

Case Study: Supercomputin...

Hyperion Research has published a new case study...

داده کاوی بزرگ مقرون به ص...

چکیده : کاوش داده ی بزرگ، اغلب نیازمند منابع محاس...

Python: Unlocking the Pow...

The programming language Python is being used to...

Opportunities Abound: HPC...

The is the first entry in a five-part insideHPC s...

آموزش کد محاسباتی سیستا (...

در این آموزش سعی داریم انرژی کل و طول پیوند مولکو...

درمورد مدل‌های آب و هوایی...

دو اصطلاح اقلیم‌شناسی و هوا‌شناسی بیشتر مواقع به‌ج...

الگوریتم تجزیه بندرز خودک...

در نسخه‌ی ۱۲٫۷ نرم‌افزار CPLEX رویه‌ی جدیدی جایگز...

نرم افزار tecplot

معرفی : Tecplot در واقع یک ابزار تجسمی و رسم نمودا...

تجزیه گر یا پارسر متون و...

آپاچی تیکا: آپاچی تیکا یکی از پروژه‌های متن باز A...

OpenFOAM v5 User Guide: I...

This guide accompanies the release of version 5.0...

OpenFOAM User Guide - Ver...

Introduction The OpenFOAM User Guide provides an...

How to Prepare Weather an...

In this video from the NVIDIA GPU Technology Conf...

مثالی از داده کاوی و تحلی...

در این پست یک تحلیل و بصری سازی خوب از گراف ۶۰،۰۰...

نرم افزار سیپلکس

معرفی : Cpelx یک بسته ی نرم افزاری شامل مجموعه ای...

تلاش AMD برای ساخت تراشه‌...

ریسک‌های کمی در دنیای فناوری به بزرگی خرج میلیارده...

معرفی، آموزش و لینک دانلو...

معرفی : ابزاری به منظور آنالیز فنی و طراحی کامپیوت...

Neurala Reduces Training...

Today Neurala announced a breakthrough update to...

با 10 باور نادرست در ارتب...

برای آنکه اطمینان حاصل کنید برنامه‌های سازمان شما...

گالری تصاویر