"""
Загрузка датасета в формате pandas.DataFrame
"""
import pandas as pd
from pathlib import Path
import pathlib
import platform
if platform.system() == 'Linux':
pathlib.WindowsPath = pathlib.PosixPath
CUR_PATH = Path(__file__).parents[0]
[документация]
def load_city_russia() -> pd.DataFrame:
"""Загрузка датасета с городами России.
Датасет содержит только уникальные значения.
================= ==============
Кол-во строк 1082
Кол-во столбцов 1
================= ==============
Returns
-------
df: pd.DataFrame
Считанные данные.
"""
df = _load_csv_data('city_russia.csv')
return df
[документация]
def load_video_games() -> pd.DataFrame:
"""Загрузка датасета с названиями видео-игр.
Датасет содержит только уникальные значения.
================= ==============
Кол-во строк 11562
Кол-во столбцов 1
================= ==============
Returns
-------
df: pd.DataFrame
Считанные данные.
"""
df = _load_csv_data('video_games.csv')
return df
[документация]
def load_exoplanes() -> pd.DataFrame:
"""Загрузка датасета с названиями планет.
Датасет содержит только уникальные значения.
================= ==============
Кол-во строк 5506
Кол-во столбцов 1
================= ==============
Returns
-------
df: pd.DataFrame
Считанные данные.
"""
df = _load_csv_data('exoplanets.csv')
return df
[документация]
def load_company_russia() -> pd.DataFrame:
"""Загрузка датасета с названиями ООО из России.
Датасет содержит только уникальные значения.
================= ==============
Кол-во строк 5245
Кол-во столбцов 1
================= ==============
Returns
-------
df: pd.DataFrame
Считанные данные.
"""
df = _load_csv_data('company_russia.csv')
return df
[документация]
def load_address_krasnoyarsk() -> pd.DataFrame:
"""Загрузка датасета с адресами Красноярска.
Датасет содержит только уникальные значения.
================= ==============
Кол-во строк 72885
Кол-во столбцов 1
================= ==============
Returns
-------
df: pd.DataFrame
Считанные данные.
"""
df = _load_csv_data('address_krasnoyarsk.csv')
return df
[документация]
def load_medical_supplies() -> pd.DataFrame:
"""Загрузка датасета с названиями медицинских препаратов.
Датасет содержит только уникальные значения.
================= ==============
Кол-во строк 1210
Кол-во столбцов 1
================= ==============
Returns
-------
df: pd.DataFrame
Считанные данные.
"""
df = _load_csv_data('medical_supplies.csv')
return df
[документация]
def load_mobile_phones() -> pd.DataFrame:
"""Загрузка датасета с названиями смартфонов.
Датасет содержит только уникальные значения.
================= ==============
Кол-во строк 223
Кол-во столбцов 1
================= ==============
Returns
-------
df: pd.DataFrame
Считанные данные.
"""
df = _load_csv_data('mobile_phones.csv')
return df
[документация]
def load_russian_dictionary() -> pd.DataFrame:
"""Словарь русских слов.
================= ==============
Кол-во строк 52129
Кол-во столбцов 1
================= ==============
Returns
-------
df: pd.DataFrame
Считанные данные.
"""
df = _load_csv_data('russian_dictionary.csv')
return df
# def load_pattern() -> pd.DataFrame:
# """Загрузка датасета с названиями pattern.
# Датасет содержит только уникальные значения.
# ================= ==============
# Кол-во строк pattern
# Кол-во столбцов pattern
# ================= ==============
# Returns
# -------
# df: pd.DataFrame
# Считанные данные.
# """
# df = _load_csv_data('pattern.csv')
# return df
[документация]
def _load_csv_data(filename: str, encoding='utf-8') -> pd.DataFrame:
"""Загрузка csv-файла.
Параметры
----------
filename : str
Путь до csv-файл.
Все csv-файлы лежат в /recs/recs/datasets/data
Например, 'city_Russia.csv'.
Returns
-------
df: pd.DataFrame
Считанный csv-файл.
"""
path = CUR_PATH / Path('data') / Path(filename)
df = pd.read_csv(path, encoding=encoding)
return df