#python #compsci Pandas is a software library written for Python for data manipulation and analysis` ## Чтение из файла Из csv файла метод .read_csv(): ![[Pasted image 20260312034112.png]] Можно посмотреть данные, data["name"], где name это колонка. ## Различный доступ к данным Можно также посмотреть данные путем data.name, где name это колонка. .head(n) позволяет отобразить первые n строк: ![[Pasted image 20260312034403.png]] ![[Pasted image 20260312034413.png]] С помощью методов .loc и .iloc можно вывести строки: ![[Pasted image 20260312034507.png]] .loc выводит по labels, а .iloc по integer-у строки Методы поддерживают срезы: ![[Pasted image 20260312034617.png]] Можно получить доступ к отдельным элементам: ![[Pasted image 20260312034735.png]] Копировать можно через метод copy: ![[Pasted image 20260312034802.png]] Также можно изменять отдельные элементы датафрейма: ![[Pasted image 20260312034849.png]] ![[Pasted image 20260312034858.png]] Можно получать доступ к данным по заданным условиям: ![[Pasted image 20260312034951.png]] ![[Pasted image 20260312035016.png]] ![[Pasted image 20260312035035.png]] ## Взаимодействие с другими типами данных Можно перевести в nparray [[NumPy]]: ![[Pasted image 20260312035155.png]] Можно перевести в [[JSON]] с помощью [[json python module|модуля json]]: ![[Pasted image 20260312035223.png]] Можно перевести в [[Python Dictionaries|словарь]]: ![[Pasted image 20260312035303.png]] Либо обратный переход: ![[Pasted image 20260312035336.png]] ## Исследование данных Метод .describe() для краткого описания: ![[Pasted image 20260312035526.png]] Среднее + среднее по строке: ![[Pasted image 20260312035732.png]] ![[Pasted image 20260312035740.png]] Уникальные значения + их количество: ![[Pasted image 20260312035805.png]] Гистограмма: ![[Pasted image 20260312035843.png]] ![[Pasted image 20260312035857.png]] Отбор по колонкам: ![[Pasted image 20260312035919.png]] ![[Pasted image 20260312035929.png]] Добавление новых колонок: ![[Pasted image 20260312040316.png]] Проверка на NaN: ![[Pasted image 20260312040342.png]] ![[Pasted image 20260312040356.png]] Отбор данных без NaN: ![[Pasted image 20260312041821.png]] ('any' значит в любой столбце может быть, 'all' значит во всех) Можно также заполнить NaN другими значениями: ![[Pasted image 20260312042332.png]] Можно ставить колонки под индекс: ![[Pasted image 20260312044903.png]] Можно совмещать датафреймы: ![[Pasted image 20260312045042.png]] "inner" значит по пересечению индексов датафреймов Можно находить матрицу корреляции колонок: ![[Pasted image 20260312045118.png]]