آموزش آنالیز داده با پایتون
فایل CSV
CSV مخفف عبارت Comma Separated Values و به معنای مقادیر جدا شده با ویرگول است. اینگونه فایلها در واقع نوعی فایل خام متنی هستند که شامل لیستی از دادهها میشوند. به صورت رایج فایلهای یاد شده برای جابهجایی دادهها بین نرمافزارهای متفاوت مورد استفاده قرار میگیرند.
خواندن داده از فایل CSV
ابتدا کتابخانه pandas را با استفاده از دستور زیر و از طریق ترمینال PyCharm نصب میکنیم
pip install pandas
در مرحله بعد با استفاده از دستورات زیر دادههای فایل dataset.csv را که یک فایل CSV است را میخوانیم. فایل dataset.csv شامل نام کاربری و کلمه عبور ۵ کاربر بوده و فاقد header است. این فایل را میتوان از اینجا دانلود نمود.
import pandas as pd
location = “c:\dataset.csv”
ds = pd.read_csv(location, header=None)
print(ds)
طریقه اضافه کردن Header به فایل CSV
با استفاده از دستورات زیر دو هدر Username و Password را به دادههای خوانده شده از فایل dataset.csv اصافه میکنیم.
import pandas as pd
location = “c:\dataset.csv”
ds = pd.read_csv(location, names=[‘Username’, ‘Password’])
print(ds)
ادامه
این کار را میتوان با دستورات زیر نیز انجام داد.
import pandas as pd
location = “c:\dataset.csv”
ds = pd.read_csv(location)
ds.columns=[‘Username’, ‘Password’]
print(ds)
ذخیره کردن داده در فایل CSV
import pandas as pd
names = [‘Reza Mohammadi’, ‘Zahra Asadi’, ‘Leila Mohebi’, ‘Sima Azadi’]
grades = [20, 18, 19, 17, 10]
grade_list = zip(names, grades)
ds = pd.DataFrame(data=grade_list, columns=[‘Full Name’, ‘Grade’])
ds.to_csv(‘c:\dataset.csv’, index=False, header=False)
خواندن داده از فایل Excell
# pip install pandas
# pip install openpyxl
import pandas as pd
location = “c:\dataset.xlsx”
ds = pd.read_excel(location)
print(ds)
ذخیره داده در فایل Excell
# pip install pandas
# pip install openpyxl
# pip install xlsxwriter
import pandas as pd
names = [“Reza Mohammadi”, “Zahra Asadi”, “Leila Mohebi”, “Sima Azadi”]
grades = [20, 18, 19, 17, 10]
grade_list = zip(names, grades)
ds = pd.DataFrame(data=grade_list, columns=[“Full Name”, “Grades”])
writer = pd.ExcelWriter(“c:\dataset.xlsx”, engine=”xlsxwriter”)
ds.to_excel(writer, sheet_name=”Information”)
writer.save()