Исходный код recs_searcher.dataset._dataframes

"""
Загрузка датасета в формате pandas.DataFrame
"""


import pandas as pd
from pathlib import Path

import pathlib
import platform
if platform.system() == 'Linux':
    pathlib.WindowsPath = pathlib.PosixPath


CUR_PATH = Path(__file__).parents[0]


[документация] def load_city_russia() -> pd.DataFrame: """Загрузка датасета с городами России. Датасет содержит только уникальные значения. ================= ============== Кол-во строк 1082 Кол-во столбцов 1 ================= ============== Returns ------- df: pd.DataFrame Считанные данные. """ df = _load_csv_data('city_russia.csv') return df
[документация] def load_video_games() -> pd.DataFrame: """Загрузка датасета с названиями видео-игр. Датасет содержит только уникальные значения. ================= ============== Кол-во строк 11562 Кол-во столбцов 1 ================= ============== Returns ------- df: pd.DataFrame Считанные данные. """ df = _load_csv_data('video_games.csv') return df
[документация] def load_exoplanes() -> pd.DataFrame: """Загрузка датасета с названиями планет. Датасет содержит только уникальные значения. ================= ============== Кол-во строк 5506 Кол-во столбцов 1 ================= ============== Returns ------- df: pd.DataFrame Считанные данные. """ df = _load_csv_data('exoplanets.csv') return df
[документация] def load_company_russia() -> pd.DataFrame: """Загрузка датасета с названиями ООО из России. Датасет содержит только уникальные значения. ================= ============== Кол-во строк 5245 Кол-во столбцов 1 ================= ============== Returns ------- df: pd.DataFrame Считанные данные. """ df = _load_csv_data('company_russia.csv') return df
[документация] def load_address_krasnoyarsk() -> pd.DataFrame: """Загрузка датасета с адресами Красноярска. Датасет содержит только уникальные значения. ================= ============== Кол-во строк 72885 Кол-во столбцов 1 ================= ============== Returns ------- df: pd.DataFrame Считанные данные. """ df = _load_csv_data('address_krasnoyarsk.csv') return df
[документация] def load_medical_supplies() -> pd.DataFrame: """Загрузка датасета с названиями медицинских препаратов. Датасет содержит только уникальные значения. ================= ============== Кол-во строк 1210 Кол-во столбцов 1 ================= ============== Returns ------- df: pd.DataFrame Считанные данные. """ df = _load_csv_data('medical_supplies.csv') return df
[документация] def load_mobile_phones() -> pd.DataFrame: """Загрузка датасета с названиями смартфонов. Датасет содержит только уникальные значения. ================= ============== Кол-во строк 223 Кол-во столбцов 1 ================= ============== Returns ------- df: pd.DataFrame Считанные данные. """ df = _load_csv_data('mobile_phones.csv') return df
[документация] def load_russian_dictionary() -> pd.DataFrame: """Словарь русских слов. ================= ============== Кол-во строк 52129 Кол-во столбцов 1 ================= ============== Returns ------- df: pd.DataFrame Считанные данные. """ df = _load_csv_data('russian_dictionary.csv') return df
# def load_pattern() -> pd.DataFrame: # """Загрузка датасета с названиями pattern. # Датасет содержит только уникальные значения. # ================= ============== # Кол-во строк pattern # Кол-во столбцов pattern # ================= ============== # Returns # ------- # df: pd.DataFrame # Считанные данные. # """ # df = _load_csv_data('pattern.csv') # return df
[документация] def _load_csv_data(filename: str, encoding='utf-8') -> pd.DataFrame: """Загрузка csv-файла. Параметры ---------- filename : str Путь до csv-файл. Все csv-файлы лежат в /recs/recs/datasets/data Например, 'city_Russia.csv'. Returns ------- df: pd.DataFrame Считанный csv-файл. """ path = CUR_PATH / Path('data') / Path(filename) df = pd.read_csv(path, encoding=encoding) return df