Original size 1140x1600

Из чего состоит вино?

PROTECT STATUS: not protected

Описание проекта

По моему мнению, вино это искусство. Для анализа я выбрала набор данных, содержащий химические характеристики и классификацию вин. Данные включают такие параметры, как содержание алкоголя, кислотность, интенсивность цвета и другие химические показатели. Источник данных — Kaggle.

Для визуализации данных я выбрала столбчатую диаграмму (чтобы сравнить средние значения ключевых характеристик для каждого класса вина), корелляционную матрицу (чтобы понять взаимосвязи между характеристиками), KDE график (для визуализации распределения алкоголя в разных классах вин), диаграмму рассеяния (для анализа связи между интенсивностью цвета и содержанием Proline).

big
Original size 1200x211

Выбор стиля

За основы стиля данного проекта я приняла цветовую палитру в градациях красного от более глубокого «винного», до менее насыщенного, как игристое, а также использую в графиках шрифт Playfair Display. Он достаточно утончённый, но при этом довольно контрастной формы, что подходит для проекта о вине.

big
Original size 1200x290
big
Original size 1200x436

Обработка данных

Для начала я импортировала необходимые мне библиотеки: seaborn, matplotlib.pyplot и pandas. После чего считала скачанный csv-файл датасета.

После чего приступила к подготовке данных для столбчатой диаграммы. Сруппировала данные по классам и средним значениям, масштабировала данные Proline для того, чтобы привести значения этой характеристики к сопоставимому масштабу с другими характеристиками вина.

Original size 1200x303
Original size 1200x441
Original size 840x541

Вывод: Класс 1 имеет более высокое содержание алкоголя и пролина, в то время как класс 3 выделяется интенсивностью цвета.

Далее обработала данные для тепловой карты корелляций, чтобы визуализировать, как разные характеристики вина связаны друг с другом и насколько сильна эта связь.

Представим, что каждая строка данной таблицы — это бутылка вина, а каждый столбец — это какая-то характеристика этого вина: содержание алкоголя, кислотность, цвет и т. д.

Понимание корреляций между характеристиками вина может помочь виноделам улучшить качество своей продукции, а также помочь потребителям лучше понимать, какие характеристики важны при выборе вина.

Original size 1200x246
Original size 1118x879

Сильные положительные корреляции (больше 0.7): Flavanoids и Total phenols (0.86) → Флавоноиды составляют значительную часть фенолов в вине. OD280/OD315 и Flavanoids (0.79) → Этот показатель, связанный с оптической плотностью, отражает содержание флавоноидов. Proline и Alcohol (0.64) → Вина с более высоким содержанием алкоголя содержат больше пролина (аминокислоты). Total phenols и OD280/OD315 (0.70) → Вполне ожидаемая связь, поскольку оптическая плотность зависит от общего количества фенольных соединений.

Сильные отрицательные корреляции (меньше -0.6): Class и Flavanoids (-0.85) → Разные классы вин имеют заметные различия в содержании флавоноидов. Class и OD280/OD315 (-0.79) → Этот показатель тоже сильно различается по классам. Class и Total phenols (-0.72) → Фенольные соединения — один из важных факторов, отличающих классы вин. Class и Hue (-0.62) → Оттенок цвета вина варьируется в зависимости от класса. Class и Proline (-0.63) → Количество пролина зависит от типа вина.

Далее построила KDE-график для визуализации распределения алкоголя в разных классах вин. Допустим, что нам нужно узнать, насколько различается крепость вина в зависимости от его типа. График показывает примерное распределение содержания алкоголя для каждого класса вина. Мы можем наблюдать:

Какие классы вин имеют более высокое содержание алкоголя в среднем.

Насколько сильно разбросано содержание алкоголя внутри каждого класса.

Есть ли какие-то «пики» в распределении (то есть, наиболее часто встречающиеся значения содержания алкоголя).

Original size 1200x338
Original size 844x541

Вина первого класса (красная линия) в основном имеют содержание алкоголя от 13% до 14,5%, в то время как вина второго класса (другой оттенок красного) имеют более широкий диапазон содержания алкоголя,

Далее обработала данные для диаграммы рассеяния, чтобы показать, есть ли какая-то связь между двумя характеристиками вина: интенсивностью цвета и содержанием пролина.

Допустим, нам нужно узнать, вина с каким типом цвета (светлые, темные) обычно содержат больше или меньше пролина.

Кроме того, раскраска точек по классам позволяет увидеть, различаются ли классы вина по этим двум характеристикам. Например, можно увидеть, что вина первого класса (один оттенок красного) в основном имеют высокую интенсивность цвета и высокое содержание пролина, в то время как вина второго класса (другой оттенок красного) имеют более низкие значения обеих характеристик.

Original size 1200x407
Original size 857x542

Далее обработала данные для ещё одной диаграммы рассеяния, чтобы показать, есть ли связь между двумя другими характеристиками вина: содержанием флавоноидов и общим количеством фенолов.

Этот график поможет понять, как связаны между собой флавоноиды и общее количество фенолов, и отличаются ли разные классы вина по этим характеристикам.

Если точки образуют линию, идущую вверх, это значит, что чем больше флавоноидов, тем больше и общее количество фенолов (положительная связь).

Если точки образуют линию, идущую вниз, это значит, что чем больше флавоноидов, тем меньше общее количество фенолов (отрицательная связь).

Если точки разбросаны хаотично, это значит, что связи между этими двумя характеристиками нет.

Original size 1200x430
Original size 844x542

Также, благодаря разным цветам для разных классов вина, можно увидеть, какие классы вина обычно имеют больше флавоноидов и фенолов. Например, может оказаться, что вина первого класса (один оттенок красного) обычно имеют высокое содержание и флавоноидов, и фенолов, в то время как вина третьего класса (другой оттенок красного) имеют низкие значения обеих характеристик. Это может говорить о том, что флавоноиды и фенолы играют важную роль в определении класса вина.

Вывод

Итак, мы посмотрели на разные характеристики вина, чтобы понять, чем отличаются разные сорта друг от друга.

Первый график (столбчатый) показал, что вина первого класса обычно самые крепкие (больше алкоголя) и содержат больше вещества под названием пролин. А вина третьего класса выделяются более насыщенным цветом.

Второй график (тепловая карта) показал, какие характеристики вина обычно идут рука об руку. Например, есть связь между количеством фенолов и флавоноидов: чем больше одного, тем больше и другого.

Третий график (KDE) показал, что у разных классов вина немного разное содержание алкоголя. У каких-то классов алкоголь более стабильный, у других — разброс больше.

Четвертый график (диаграммма рассеяния) показал, что есть связь между интенсивностью цвета вина и количеством в нём пролина. И эта связь немного различается для разных классов вина.

Пятый график (диаграмма расеяния) подтвердил, что флавоноиды и фенолы обычно встречаются вместе, и что вина разных классов содержат разное количество этих веществ.»

В общем, из этих графиков можно сделать вывод, что разные классы вина действительно отличаются по своим характеристикам.

Использование нейросетей

Обложка проекта сгенерирована нейросетью https://fusionbrain.ai/editor/) промт: Бокал, наполненный красным вином глубокого кровавого цвета.

Из чего состоит вино?
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more