![](https://noxai.org/wp-content/uploads/2024/03/noxai-300x300.png?size=200x200&quality=95&crop=0,0,1500,1500&ava=1)
Привет! Сегодня я хочу рассказать вам о том, как я создал датасет на Python из папки с фотографиями. Это было необходимо для моего проекта машинного обучения, где мне требовалось обучить модель распознаванию объектов на изображениях. Я поделился с вами моим процессом, чтобы помочь другим, кто столкнулся с похожими задачами.1. Импортирование необходимых модулей⁚
Я начал с импорта необходимых модулей в Python. Для работы с файловой системой я использовал модуль os, а для работы с изображениями ⏤ модуль imageio. Для удобства я также использовал модуль progressbar, чтобы отслеживать прогресс.2. Определение папки с фотографиями⁚
Затем я указал путь к папке, в которой находятся мои фотографии. Это можно сделать с помощью функции os.path.join, где я указал путь к папке и ее название.3. Обход папки с фотографиями⁚
Я использовал функцию os.listdir, чтобы получить список всех файлов в папке с фотографиями. Затем я установил счетчик, чтобы отслеживать количество обработанных файлов.4. Чтение и обработка изображений⁚
Для каждого файла в папке я использовал функцию imageio.imread, чтобы прочитать изображение и сохранить его в переменную. Затем я выполнил необходимую обработку и предварительную обработку изображения, включая изменение размера, изменение контрастности и т. д.5. Создание датасета⁚
Для каждого изображения я создал пару, состоящую из самого изображения и его метки. Метка была определена в соответствии с требованиями моего проекта. Затем я добавил каждую пару в список, который является основой моего датасета.6. Сохранение датасета⁚
Наконец, я использовал функцию numpy.save, чтобы сохранить созданный датасет в формате .npy. Это удобный формат для дальнейшей работы с данными в Python.
Вот и всё! Теперь я имею полный и готовый датасет, который можно использовать в своем проекте машинного обучения. Надеюсь, что эта статья поможет вам сделать то же самое. Удачи в вашем проекте!