Skip to content

영문-한글 음역기. English-to-Hangul transliterator. Work in progress.

License

Notifications You must be signed in to change notification settings

gwangmu/eng-to-hangul

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Click here for English

English to Hangul

sample_output

English sentence to naturally-sounding (augmented) Hangul notation.

About Augmented Hangul

Augmented Hangul is an augmented Hangul for pronunciation that doesn't exist in Korean but does exist in English. Since there is no "standard" augmentation, this project invented it using limited knowledge of linguistics and, of course, common sense. The purpose is to help native Korean speakers pronounce English better, or at least recognizable to someone non-native in not only Korean but also English.

Consonants with Diacritical Marks

The diacritical marks were purposefully added to the closest Hangul consonants. The class suggests what needs attention.

Class Sound Consonant Example Explanation
Lip /v/ image image (Very) Softly bite the lower lip.
/f/ image image (Beautiful) Softly bite the lower lip.
Tongue /r/ image image (Room) Roll your tongue.
/θ/ image image (The) Softly bite your tongue.
/ð/ image image (Without) Softly bite your tongue.
Stress /z/ image image (Zone) Stress 'ㅅ'.

Self-consonants

Self-consonants are simply consonants without a vowel. If you're unfamiliar with this concept, add 'ㅡ' but speak it very shortly, or don't use your vocal cord unless the consonant requires it.

Example IPA Pronunciation Standard Hangul Equivalent
image [ðɪs] 디스
image [teɪk] 테이크
image [fraɪz] 프롸이즈
image [straɪk] 스트롸이크

Example Sentences

Example English Sentence Standard Hangul Equivalent
image If you go there, you will find him. 이프 유 고우 데얼, 유 윌 파인드 임.
image I'll do it immediately. 아일 두 이트 이미티어틀리.
image I have too much work to do. 아이 해브 투 머츠 월크 투 두.
image He wanted very badly to survive. 히 원티드 베뤼 배들리 투 설바이브.
image I don't want a birthday party. 아이 도운트 원트 어 벌뜨데이 팔티.
If you care to read more...

Motivation

The basic philosophy behind this is, "We can only imagine just as much as we can describe."

Because some pronunciation is lacking in Korean, native Korean speakers are particularly bad at some pronunciation, so much so that non-Koreans may find it difficult to understand. I reckon this is because they cannot "imagine" how to pronounce those lacking pronunciation, such as consonant clusters. To make matters a little worse, native Koreans tend to use Hangul to "emulate" any sounds because Hangul is excellent at it. The only problem is that some of the pronunciation is lacking in Hangul, which makes Koreans' "imagination" stop there.

My solution is introducing diacritical marks and self-consonants so that any Hangul user can "imagine" those lacking sounds and speak them better. Specifically, diacritical marks will describe the missing sounds in Hangul (i.e., /f/, /v/, /z/, /r/, /θ/, and /ð/), and self-consonants will describe consonant clusters (e.g., alps or strike). They were deliberately designed to fit in the regular Hangul as seamlessly as possible so that people who had not heard of augmented Hangul could still read it roughly. For example, the 'ㄸ' with a diacritical mark indicates /θ/, but clueless readers may simply ignore the diacritical marks but still get the closest approximation (i.e., 'ㄸ').

My Two-cents

The languages that use Latin alphabets (i.e., A to Z) routinely add diacritical marks to the closest alphabets to describe their unique sounds, and for the letters that they don't use, they just simply leave it in the Alphabet set so that they can use them to describe other language pronunciation. I think Hangul can do this the other way around: we add diacritical marks and a new concept (i.e., consonant clusters) to describe other language pronunciation and use regular Hangul letters to describe Korean as it's always been.

This was written when I first thought about augmented Hangul, though at that point, I thought /z/ doesn't need to be thoroughly described in Hangul so I ruled out /z/ from the list. Full disclosure: I was wrong.

Installation

Currently, there is only official support for Ubuntu 22.04+.

  1. Download or clone this repository.
  2. Type sudo make in the root directory.
  3. (For Ubuntu users) Type sudo make dep-ubuntu in the root directory to install dependencies.

How to Use

  • As a standalone program: $ eng-to-hangul "<english-sentence-here>"
  • As a Python package: import eng_to_hangul
Options and details
  • For the standalone program
    • -f <filename>: Read from <filename> and convert it line by line.
    • -D: Don't draw the Hangul sentence. Output only in the terminal.
    • -o <filename>: Print the output to <filename> (if empty, on the screen).
    • -s: Print in the regular Hangul.
    • -A: Turn off diacritical marks.
    • -C: Turn off self consonants. Self-consonants will be assigned with 'ㅡ.'
    • -r: Retrieve every possible pronunciation.
  • For the Python package
    • (Details to be added)

Notes

  • eng-to-hangul uses eng-to-ipa from @mphilli for English-to-IPA transliteration.
  • It is not mandatory, but please let me know or leave a link to this repository if you use this.
  • Contributions and suggestions are always welcome, but please try to be constructive. Rants will be ignored.

영문-한글 음역기

sample_output

영문장에서 자연스럽게 들리는 (증강) 한글 표기로 음역.

증강 한글

증강 한글은 한국어에는 없지만 영어에는 존재하는 발음을 표기하기 위해 증강된 한글입니다. 현 한글에 "표준" 증강 한글은 없는 바, 이 프로젝트는 제한된 언어학과 상식을 동원해 자체 발명된 증강 한글을 이용합니다. 증강 한글은 한국어 원어민이 영어/한국어 원어민이 알아들을 수 있는 발음을 구사하는 데 목적을 두고 있습니다.

분음부호 표기된 자음

한국어에 없는 발음을 표기하기 위헤 기존의 가장 가까운 자음 옆에 분음부호(예: ö 위의 점)를 붙입니다. 아래 표의 '종류'는 해당 자음에서 어떤 부분에 신경써야 하는 지를 의미합니다.

종류 발음 자음 설명
입술 /v/ image image (Very) 아랫 입술을 가볍게 물기.
/f/ image image (Beautiful) 아랫 입술을 가볍게 물기.
/r/ image image (Room) 를 말기.
/θ/ image image (The) 를 가볍게 물기.
/ð/ image image (Without) 를 가볍게 물기.
강조 /z/ image image (Zone) 'ㅅ' 을 강조하기.

홀자음

홀자음은 모음이 없는 자음입니다. 모음 없는 자음에 익숙하지 않은 경우, 모음 'ㅡ'가 있다고 가정하되 최대한 'ㅡ' 발음을 짧게하고, 자음에서 필요로 하지 않는 한 성대를 쓰지 않도록 합니다.

IPA 표기 표준 한글 표기
image [ðɪs] 디스
image [teɪk] 테이크
image [fraɪz] 프롸이즈
image [straɪk] 스트롸이크

예문

영문장 표준 한글 표기
image If you go there, you will find him. 이프 유 고우 데얼, 유 윌 파인드 임.
image I'll do it immediately. 아일 두 이트 이미티어틀리.
image I have too much work to do. 아이 해브 투 머츠 월크 투 두.
image He wanted very badly to survive. 히 원티드 베뤼 배들리 투 설바이브.
image I don't want a birthday party. 아이 도운트 원트 어 벌뜨데이 팔티.
더 읽을거리

동기

이 프로젝트의 기본 철학은 "묘사할 수 있는 만큼 상상할 수 있다"입니다.

한국어 원어민이라면 흔히 한국어에는 없는 영어를 발음하는데 어려움을 겪는데, 심한 경우 이는 한국어 비원어민이 알아듣기 힘든 발음 문제로 이어집니다. 이는 한국인이 해당 발음을 "상상하기 힘들다"는 점에서 비롯되는 것으로 (예: 자음 클러스터 - 모음 없는 자음들의 묶음), 특히 발음을 "한글"로 상상하는 경향이 있는 한국어 원어민들에게는 한글로 묘사할 수 있는 발음의 한계가 사용자 스스로의 발음 한계로 이어지기 쉽습니다.

이 문제에 대한 이 프로젝트의 해결책은 기존 한글에 분음부호와 홀자음을 추가해 한글 사용자로 하여금 해당 발음들을 "상상할 수 있도록" 만들자는 것입니다. 분음부호는 한글에 없는 발음(/f/, /v/, /z/, /r/, /θ/, /ð/)을 위해, 홀자음은 한국어에 없는 자음 클러스터를 묘사하기 위해 사용됩니다. 분음부호와 홀자음으로 증강된 한글은 이에 익숙하지 않은 한글 사용자들도 쉽게 이해하고 읽을 수 있도록 의도적으로 설계되었습니다. 예를 들어, 분음부호가 붙은 'ㄸ'은 음가 /θ/를 갖지만 분음부호를 무시하고도 /θ/에 가장 근사한 발음인 'ㄸ'으로 해석될 수 있습니다.

개인적 사색

영문 알파벳을 이용하는 대다수의 언어들은 자체 언어에 적절한 발음을 표기하기 위해 흔히 분음부호를 활용합니다 (예: /œ/("외") 발음을 위해 가장 가까운 알파벳인 "o" 에 분음부호 움라우트(Unlaut)를 붙여 "ö"). 더 나아가, 반대로 혹 사용하지 않는 알파벳이 생기더라도 이를 외국어 발음을 묘사하는 데 이용하는데 (예: 이탈리아어 자체에는 k나 y가 없지만 외국어 표기를 위해 사용), 개인적 소견은 한글은 이와 정반대로 분음부호를 활용할 수 있다는 것입니다. 즉, 한글은 외국어를 위해 분음부호를 사용하고, 분음부호가 없는 글자를 통상적 한국어 표기를 위해 사용할 수 있을 것입니다.

(블로그 포스트 (영문): 증강 한글에 대한 초창기 구상)

설치

현재 Ubuntu 22.04+만 공식 지원.

  1. 이 레포지토리(저장소, repository)를 다운로드 혹은 클론.
  2. 터미널에서 레포지토리 디렉토리로 이동한 후 sudo make를 입력.
  3. (우분투 유저) 의존성 설치를 위해 레포지토리 디렉토리에서 sudo make dep-ubuntu를 입력.

사용법

  • 자체 프로그램으로: $ eng-to-hangul "<english-sentence-here>"
  • Python 패키지로: import eng_to_hangul
옵션 및 상세
  • 자체 프로그램 옵션
    • -f <filename>: <filename> 파일에서 읽은 후 한 줄씩 음역.
    • -D: 결과를 GUI에 그리지 않고 터미널에만 출력.
    • -o <filename>: 결과를 <filename>에 저장 (기본값: 화면).
    • -s: 표준 한글 표기로 결과 생성.
    • -M: 분음부호 끄기.
    • -C: 홀자음에 모음 'ㅡ'을 덧붙임.
    • -r: 가능한 모든 발음을 결과로 받기.
  • Python 패키지
    • (향후 추가 예정)

주석

  • 이 프로젝트는 영문에서 IPA 표기로 음역을 위해 @mphilli가 개발한 eng-to-ipa을 사용합니다.
  • 이 프로젝트를 사용하시는 경우 프로젝트 개발자에게 귀띔주시거나 프로젝트 링크를 남겨주실 것을 부탁합니다.
  • 제안이나 기여는 언제든 환영합니다. 분노/비방/폭언은 자연스럽게 무시될 예정입니다.
Technical TODOs
  • (Important) Provide a friendlier interface to non-terminal or non-Linux users.
  • (Important) Package the repository more nicely. (Help needed!)
    • Installing non-pip dependencies (e.g., python3-tk, python3-pil.imagetk, and UnDotum)
    • Printing post-install messages after installation. (in setup.py)
    • Uploading this repository to a Python package manager.
  • Improve handling of the variations of pronunciation.
  • Support pronunciation preference.
  • Support drawing regular Hangul sentences.