تحلیل داده python

قسمت ششم: خوشه بندی به روش KMeans (Unsupervised Learning)

قسمت ششم: خوشه بندی به روش KMeans (Unsupervised Learning)

در این قسمت می خواهیم با استفاده از روش معروف خوشه بندی KMeans دسته های مختلف را بین درآمد در سن های مختلف را شناسایی کنیم. به همین منظور ابتدا به صورت فرضی یک سری داده های آماری تولید می کنیم. این داده شامل سن افراد و میزان درآمد آن هاست. تابع زیر اینکار را مشاهده ادامه مطلب…

قسمت پنجم: تشخیص ایمیل اسپم و غیر اسپم با استفاده از قاعده بیز

قسمت پنجم: تشخیص ایمیل اسپم و غیر اسپم با استفاده از قاعده بیز

در این قسمت سعی داریم با استفاده از قضیه بیز تشخیص دهیم یک محتوای ایمیل اسپم است یا غیر اسپم. برای اینکار لازم است تا برای آموزش مدل از ایمیل های اسپم و غیر اسپم استفاده کنیم. این مجموعه ایمیل ها را که به صورت فایل فشرده در آمده از این لینک دانلود کنید. مثلا مشاهده ادامه مطلب…

قسمت چهارم: مدل کردن یا برازش منحنی روی داده ها در پایتون

قسمت چهارم: مدل کردن یا برازش منحنی روی داده ها در پایتون

فرض کنید یک سایت خرید داریم، که میزان خرید با سرعت لود شدن صفحه سایت ارتباط دارد. حال میخواهیم این ارتباط را مدل کنیم. در برنامه زیر ابتدا یک سری داده ها فرضی از میزان خرید و سرعت لود شدن صفحه سایت تولید می کنیم. سپس قسمتی از داده ها را برای مدل کردن منحنی مشاهده ادامه مطلب…

قسمت سوم: ارتباط بین سن بازدیدکنندگان وبسایت و احتمال خرید آن ها با استفاده از احتمال شرطی

قسمت سوم: ارتباط بین سن بازدیدکنندگان وبسایت و احتمال خرید آن ها با استفاده از احتمال شرطی

در مثال زیر میخواهیم ارتباط بین سن خریداران و میزان خرید آن ها را متوجه شویم. بنابراین فرض می کنیم دو دیکشنری زیر مربوط به دهه های سنی مختلف از 20 تا 70 سال باشد باشد:

  ابتدا یک دیتافریم از این دیکشنری ها تشکیل می دهیم:

  ترکیب دو دیتافریم :

مشاهده ادامه مطلب…

قسمت دوم: محاسبه پارامترهای آماری رایج در پایتون

قسمت دوم: محاسبه پارامترهای آماری رایج در پایتون

قبل از شروع لازم است تا ماژول های لازم را فراخوانی نمایید :

  تولید اعداد تصادفی به صورت توزیع نرمال مربوط به دستمزد کارگران

نمایش هیستوگرام 50 تکه ای مربوط به داده های بالا

محاسبه میانگین و میانه  

محاسبه انحراف معیار و واریانس

  نمایش بیشتر فراوانی یا مشاهده ادامه مطلب…

قسمت اول: مروری بر ماژول تحلیل داده و ساختار ساز Pandas

قسمت اول: مروری بر ماژول تحلیل داده و ساختار ساز Pandas

ابتدا لازم است تا این ماژول را از سایت http://pandas.pydata.org/ دریافت کرده و نصب کنید. و از طریق خط فرمان cmd با استفاده از دستور pip install pandas به راحتی نصب کنید. قبل از شروع لازم است تا ماژول های لازم را فراخوانی کنید به این صورت :

  سه ساختار در pandas پشتیبانی مشاهده ادامه مطلب…