Original size 1240x1750

Анализ данных о звёздах

PROTECT STATUS: not protected
6

В данном исследовании используется набор данных, представленный в табличной форме в открытом доступе на сайте «Gigasheet», и содержащий информацию о звездах. Таблица включает числовые параметры: светимость, радиус, звездная величина и тип, а также категориальные признаки: цвет и класс.

big
Original size 736x292

Я выбрала данные о звездах для анализа, потому что меня всегда интересовала астрономия, и этот набор данных позволяет практиковаться в анализе без нужды в глубоких астрономических знаниях. Цель — проверить на практике различные методы анализа данных на доступном и понятном примере.

Выбор данных для каждого типа графика обусловлен целесообразностью их визуализации с помощью именно этого типа графика. Например, распределение по классам лучше всего иллюстрируется столбчатой или круговой диаграммой, а взаимосвязь между двумя числовыми параметрами — точечной диаграммой.

Этапы

В первую очередь для написания кода были загружены библиотеки для работы с графиками и шрифтами, файл с таблицей и кастомный шрифт. Также для всех графиков была подобрана цветовая палитра с помощью Adobe Colour, напоминающая звёздное небо. Также с промптом «звёздное небо» была сгенерирована обложка проекта в нейросети Playground.

big
Original size 1130x291
big
Original size 1696x521

Палитра, созданная с помощью Adobe Color

Затем необходимо было обработать данные, убрав из них пустые ячейки, некорректные значения и изменить формат данных в подходящия для анализа, например перевести строки в числа и так далее.

Original size 1284x170

Далее необходимо было перейти к построению графиков. На дланном этапе использовался чат GPT для решения возникающих проблем, нахождения ошибок в коде и подборе оптимальных методов построения. Например, поиск способов убрать сетку графика, белую обводку столбцов, создать легенду графика и переместить её в необходимое место. Далее этот же шаблон применялся при построении каждого графика.

Original size 1298x255
Original size 1343x443

В конце осталось лишь разместить код более удачно в рамках картинки и сохранить её в хорошем разрешении.

Original size 1212x257

Графики

Original size 1080x731

Частота встречаемости разных классов звёзд

Этот график показывсает, что чаще всего встречаются звёзды класса М — самого низкого из всех, а затем классы В и О — которые напротив занимают первое и второе место в классификации.

При этом следующий график демонстрирует, что звёзды класса M являются самыми маленькими, тогда как А имеют самый большой средний радиус.

Original size 907x726

Соотношение среднего радиуса звёзд и их класса

Original size 965x737

Зависимость цвета звёзд от температуры

Это т график показывает, как температура звёзд напрямую влияет на их цвет.

Original size 951x804

Как изменяется количество звезд в зависимости от свечения

И последней зависимостью, которую я исследую, является уровень светимости звёзд. Для этого я разделила все данные о светимости на пять равных интервалов и подсчитала количество звёзд в каждом.

Ссылки

Анализ данных о звёздах
6
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more