آموزش آنالیز داده با پایتون


فایل‌ CSV

CSV مخفف عبارت Comma Separated Values و به معنای مقادیر جدا شده با ویرگول است. اینگونه فایل‌ها در واقع نوعی فایل خام متنی هستند که شامل لیستی از داده‌ها می‌شوند. به صورت رایج فایل‌های یاد شده برای جابه‌جایی داده‌ها بین نرم‌افزارهای متفاوت مورد استفاده قرار می‌گیرند.

خواندن داده از فایل CSV

ابتدا کتابخانه pandas را با استفاده از دستور زیر و از طریق ترمینال PyCharm نصب می‌کنیم

pip install pandas

در مرحله بعد با استفاده از دستورات زیر داده‌های فایل dataset.csv را که یک فایل CSV است را می‌خوانیم. فایل dataset.csv شامل نام کاربری و کلمه عبور ۵ کاربر بوده و فاقد header است. این فایل را می‌توان از اینجا دانلود نمود.

import pandas as pd
location = “c:\dataset.csv”
ds = pd.read_csv(location, header=None)
print(ds)

طریقه اضافه کردن Header به فایل CSV

با استفاده از دستورات زیر دو هدر Username و Password را به داده‌های خوانده شده از فایل dataset.csv اصافه می‌کنیم.

import pandas as pd
location = “c:\dataset.csv”
ds = pd.read_csv(location, names=[‘Username’, ‘Password’])
print(ds)

ادامه‌