data mining در پایتون

قسمت ششم: خوشه بندی به روش KMeans (Unsupervised Learning)

قسمت ششم: خوشه بندی به روش KMeans (Unsupervised Learning)

در این قسمت می خواهیم با استفاده از روش معروف خوشه بندی KMeans دسته های مختلف را بین درآمد در سن های مختلف را شناسایی کنیم. به همین منظور ابتدا به صورت فرضی یک سری داده های آماری تولید می کنیم. این داده شامل سن افراد و میزان درآمد آن هاست. تابع زیر اینکار را مشاهده ادامه مطلب…

قسمت سوم: ارتباط بین سن بازدیدکنندگان وبسایت و احتمال خرید آن ها با استفاده از احتمال شرطی

قسمت سوم: ارتباط بین سن بازدیدکنندگان وبسایت و احتمال خرید آن ها با استفاده از احتمال شرطی

در مثال زیر میخواهیم ارتباط بین سن خریداران و میزان خرید آن ها را متوجه شویم. بنابراین فرض می کنیم دو دیکشنری زیر مربوط به دهه های سنی مختلف از 20 تا 70 سال باشد باشد:

  ابتدا یک دیتافریم از این دیکشنری ها تشکیل می دهیم:

  ترکیب دو دیتافریم :

مشاهده ادامه مطلب…

قسمت اول: مروری بر ماژول تحلیل داده و ساختار ساز Pandas

قسمت اول: مروری بر ماژول تحلیل داده و ساختار ساز Pandas

ابتدا لازم است تا این ماژول را از سایت http://pandas.pydata.org/ دریافت کرده و نصب کنید. و از طریق خط فرمان cmd با استفاده از دستور pip install pandas به راحتی نصب کنید. قبل از شروع لازم است تا ماژول های لازم را فراخوانی کنید به این صورت :

  سه ساختار در pandas پشتیبانی مشاهده ادامه مطلب…