
Для определения архитектуры решения и разработки статистических моделей предсказания загрязнения воздуха, мы использовали несколько методов статистического моделирования. Первым методом, который мы применили, была множественная регрессия. Мы использовали этот метод, чтобы выявить зависимость между загрязнением воздуха и различными факторами, такими как промышленные выбросы, транспортные средства и погодные условия. С помощью множественной регрессии мы определили значимость каждого фактора влияния на уровень загрязнения воздуха и построили модель, которая может предсказывать уровень загрязнения на основе этих факторов. Вторым методом, который мы использовали, был временной ряд. Мы проанализировали исходные данные с помощью методов декомпозиции временных рядов, чтобы выделить детерминированную и случайную компоненты. Детерминированная компонента отражает общие тренды и сезонность загрязнения воздуха, а случайная компонента отражает шум или случайные колебания. Мы проанализировали зависимость этих компонент от зависимых и независимых показателей исследования и использовали их для построения модели предсказания. Также, помимо этих методов, мы использовали другие статистические методы, такие как анализ факторов и кластерный анализ, чтобы получить дополнительные инсайты и выделить группы горожан и окружающей среды с различными уровнями загрязнения. В итоге, на основе всех этих методов статистического моделирования, мы разработали архитектуру решения, которая включает в себя модель предсказания загрязнения воздуха на основе различных факторов. Эта модель позволяет администрации города принимать информированные решения по улучшению качества окружающей среды и здоровья горожан.