Skip to content

Latest commit

 

History

History
92 lines (82 loc) · 5.05 KB

README.ua.md

File metadata and controls

92 lines (82 loc) · 5.05 KB

header

Опис

PyPI version

Розбирання адреси на типи. Адаптація бібліотеки usaddress під українські адреси

Read this in other language: English, Русский, Український

Вимоги

Встановлення

pip3 install uaddress

Встановлення локально

python3 setup.py install --user

Навчання моделі

parserator train training/data.xml uaddress

Коли інше розташування моделі

parserator train training/data.xml uaddress --modelfile anotherpath/uaddr.crfsuite

Тестування моделі

parserator label training/raw.csv training/data.xml uaddress

Коли інше розташування моделі

parserator label trainig/raw.csv training/data.xml uaddress --modelfile anotherpath/uaddr.crfsuite

Структура

Файл Опис
training/data.xml Набір даних для моделі
training/raw.csv Список адрес для навчання або перевірки
uaddress/uaddr.crfsuite NLP модель

Приклади

example1

Приклад скрипту

python3 example.py

example2

Типи

Назва Опис
Country Країна
RegionType Тип області
Region Область
CountyType Тип району
County Район
SubLocalityType Тип підрайону
SubLocality Підрайон
LocalityType Тип населеного пункту
Locality Населений пункт
StreetType Тип вулиці
Street Вулиця
HousingType Тип корпусу
Housing Корпус
HostelType Тип гуртожитку
Hostel Гуртожиток
HouseNumberType Тип номеру будинку
HouseNumber Номер будинку
HouseNumberAdditionally Додатковий номер будинку
SectionType Тип секції
Section Секція
ApartmentType Тип квартири
Apartment Квартира
RoomType Тип кімнати
Room Кімната
Sector Сектор
EntranceType Тип під'їзду
Entrance Номер під'їзду
FloorType Тип поверху
Floor Поверх
PostCode Індекс
Manually Набір типів для подальшого розбирання адреси
NotAddress Не адреса
Comment Коментар
AdditionalData Додаткові дані