Python. Как получить столбцы с числовыми значениями и построить графики
Привет! Меня зовут Андрей, и сегодня я расскажу тебе, как использовать Python для получения столбцов с числовыми значениями из данных, которые представлены в виде строк. Также я покажу, как удалить строки с пропущенными значениями и построить графики на основе полученных числовых столбцов.Для начала, нам потребуется установить несколько библиотек⁚ pandas, matplotlib и numpy. Если у тебя их нет, то воспользуйся командой `pip install`, чтобы установить их.Импортируем необходимые библиотеки⁚
python
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
Затем, загрузим данные в объект DataFrame с помощью функции `read_csv` из библиотеки pandas⁚
python
data pd.read_csv(‘data.csv’)
Предположим, что наши данные находятся в файле `data.csv`.Теперь, давайте посмотрим на структуру данных, чтобы понять, какие столбцы содержат числовую информацию. Воспользуемся методом `info`, который позволит нам увидеть информацию о каждом столбце⁚
python
data.info
После запуска этого кода, мы получим информацию о каждом столбце, включая его тип данных. Обрати внимание на столбцы, которые содержат знаки валюты. Обычно они представлены в виде строк, но мы хотим получить числовые значения.Чтобы преобразовать строки в числа, мы можем использовать метод `replace` из библиотеки pandas. Например, если в нашем столбце значение представлено как ″$50″, мы можем заменить символ доллара на пустую строку и преобразовать оставшуюся часть в число⁚
python
data[‘column_name’] data[‘column_name’].replace(‘[\$,]’, », regexTrue).astype(float)
Здесь `’column_name’` ⏤ это название нашего столбца. Мы использовали регулярное выражение `[\$,]`, чтобы найти все символы доллара и запятые в столбце и заменить их пустой строкой. Затем мы использовали метод `astype(float)`, чтобы преобразовать оставшуюся часть в число с плавающей точкой.Теперь, когда у нас есть числовые значения, мы можем построить графики. Используем метод `plot` из библиотеки matplotlib⁚
python
data.plot(x’column_x’, y’column_y’, kind’line’)
Здесь `’column_x’` и `’column_y’` — это названия столбцов, которые мы хотим использовать для оси x и y. Мы также указали `kind’line’` для построения простой линейной диаграммы.Наконец, чтобы удалить строки с пропущенными значениями, мы можем использовать метод `dropna` из библиотеки pandas⁚
python
data data.dropna
После выполнения этой команды, все строки с пропущенными значениями будут удалены из нашего набора данных.
И вот, мы получили столбцы с числовыми значениями и построили графики на основе этих значений! Теперь ты можешь использовать эти методы для анализа данных и создания своих графиков.
Я надеюсь, что эта статья была полезной для тебя. Удачи в изучении Python!