Glossarion / PatternManager.py
Shirochi's picture
Upload 93 files
ec038f4 verified
# -*- coding: utf-8 -*-
# =====================================================
# UNIFIED PATTERNS AND CONSTANTS
# Module-level constants for better pickle compatibility
# =====================================================
import re
import os
from bs4 import BeautifulSoup
# Move all patterns to module level for ProcessPoolExecutor compatibility
CHAPTER_PATTERNS = [
# English patterns
(r'chapter[\s_-]*(\d+)', re.IGNORECASE, 'english_chapter'),
(r'\bch\.?\s*(\d+)\b', re.IGNORECASE, 'english_ch'),
(r'part[\s_-]*(\d+)', re.IGNORECASE, 'english_part'),
(r'episode[\s_-]*(\d+)', re.IGNORECASE, 'english_episode'),
# Chinese patterns
(r'็ฌฌ\s*(\d+)\s*[็ซ ่Š‚่ฉฑ่ฏๅ›ž]', 0, 'chinese_chapter'),
(r'็ฌฌ\s*([ไธ€ไบŒไธ‰ๅ››ไบ”ๅ…ญไธƒๅ…ซไนๅ็™พๅƒไธ‡]+)\s*[็ซ ่Š‚่ฉฑ่ฏๅ›ž]', 0, 'chinese_chapter_cn'),
(r'(\d+)[็ซ ่Š‚่ฉฑ่ฏๅ›ž]', 0, 'chinese_short'),
# Japanese patterns
(r'็ฌฌ\s*(\d+)\s*่ฉฑ', 0, 'japanese_wa'),
(r'็ฌฌ\s*(\d+)\s*็ซ ', 0, 'japanese_chapter'),
(r'ใใฎ\s*(\d+)', 0, 'japanese_sono'),
(r'(\d+)่ฉฑ็›ฎ', 0, 'japanese_wame'),
# Korean patterns
(r'์ œ\s*(\d+)\s*[์žฅํ™”๊ถŒ๋ถ€ํŽธ]', 0, 'korean_chapter'),
(r'(\d+)\s*[์žฅํ™”๊ถŒ๋ถ€ํŽธ]', 0, 'korean_short'),
(r'์—ํ”ผ์†Œ๋“œ\s*(\d+)', 0, 'korean_episode'),
# Generic numeric patterns
(r'^\s*(\d+)\s*[-โ€“โ€”.\:]', re.MULTILINE, 'generic_numbered'),
(r'_(\d+)\.x?html?$', re.IGNORECASE, 'filename_number'),
(r'/(\d+)\.x?html?$', re.IGNORECASE, 'path_number'),
(r'(\d+)', 0, 'any_number'),
]
FILENAME_EXTRACT_PATTERNS = [
# IMPORTANT: More specific patterns MUST come first
r'^\d{3}(\d)_(\d{2})_\.x?html?$', # Captures both parts for decimal: group1.group2
r'^\d{4}_(\d+)\.x?html?$', # "0000_1.xhtml" - extracts 1, not 0000
r'^\d+_(\d+)[_\.]', # Any digits followed by underscore then capture next digits
r'^(\d+)[_\.]', # Standard: "0249_" or "0249."
r'response_(\d+)_', # Standard pattern: response_001_
r'response_(\d+)\.', # Pattern: response_001.
r'(\d{3,5})[_\.]', # 3-5 digit pattern with padding
r'[Cc]hapter[_\s]*(\d+)', # Chapter word pattern
r'[Cc]h[_\s]*(\d+)', # Ch abbreviation
r'No(\d+)Chapter', # No prefix with Chapter - matches "No00013Chapter.xhtml"
r'No(\d+)Section', # No prefix with Section - matches "No00013Section.xhtml"
r'No(\d+)(?=\.|_|$)', # No prefix followed by end, dot, or underscore (not followed by text)
r'็ฌฌ(\d+)[็ซ ่ฏๅ›ž]', # Chinese chapter markers
r'_(\d+)(?:_|\.|$)', # Number between underscores or at end
r'^(\d+)(?:_|\.|$)', # Starting with number
r'(\d+)', # Any number (fallback)
]
CJK_HONORIFICS = {
'korean': [
# Modern honorifics
'๋‹˜', '์”จ', '์„ ๋ฐฐ', 'ํ›„๋ฐฐ', '๋™๊ธฐ', 'ํ˜•', '๋ˆ„๋‚˜', '์–ธ๋‹ˆ', '์˜ค๋น ', '๋™์ƒ',
'์„ ์ƒ๋‹˜', '๊ต์ˆ˜๋‹˜', '๋ฐ•์‚ฌ๋‹˜', '์‚ฌ์žฅ๋‹˜', 'ํšŒ์žฅ๋‹˜', '๋ถ€์žฅ๋‹˜', '๊ณผ์žฅ๋‹˜', '๋Œ€๋ฆฌ๋‹˜',
'ํŒ€์žฅ๋‹˜', '์‹ค์žฅ๋‹˜', '์ด์‚ฌ๋‹˜', '์ „๋ฌด๋‹˜', '์ƒ๋ฌด๋‹˜', '๋ถ€์‚ฌ์žฅ๋‹˜', '๊ณ ๋ฌธ๋‹˜',
'๋Œ€ํ‘œ๋‹˜', '์›์žฅ๋‹˜', '๊ตญ์žฅ๋‹˜', '์ฐจ์žฅ๋‹˜', '์ฃผ์ž„๋‹˜', '๋ฐ˜์žฅ๋‹˜',
'์ž‘๊ฐ€๋‹˜', '๊ธฐ์ž๋‹˜', 'ํ”ผ๋””๋‹˜', '๊ฐ๋…๋‹˜', '๋งค๋‹ˆ์ €๋‹˜', '์ฝ”์น˜๋‹˜',
# Classical/formal honorifics
'๊ณต', '์˜น', '๊ตฐ', '์–‘', '๋‚ญ', '๋ž‘', '์ƒ', '์ž', '๋ถ€', '๋ชจ', '์‹œ', '์ œ', '์กฑํ•˜',
# Royal/noble address forms
'๋งˆ๋งˆ', '๋งˆ๋…ธ๋ผ', '๋Œ€๊ฐ', '์˜๊ฐ', '๋‚˜๋ฆฌ', '๋„๋ น', '๋‚ญ์ž', '์•„์”จ', '๊ทœ์ˆ˜',
'๊ฐํ•˜', '์ „ํ•˜', 'ํํ•˜', '์ €ํ•˜', 'ํ•ฉํ•˜', '๋Œ€๋น„', '๋Œ€์™•', '์™•์ž', '๊ณต์ฃผ',
'๋นˆ๊ถ', '์ค‘์ „', '์„ธ์ž', '๊ตฐ์ฃผ', 'ํƒœ์ž', '์„ฑ๊ตฐ',
# Buddhist/religious
'์Šค๋‹˜', '์‚ฌ๋ถ€๋‹˜', '์กฐ์‚ฌ๋‹˜', 'ํฐ์Šค๋‹˜', 'ํ™”์ƒ', '๋Œ€๋•', '๋Œ€์‚ฌ', '๋ฒ•์‚ฌ',
'์„ ์‚ฌ', '์œจ์‚ฌ', '๋ณด์‚ด๋‹˜', '๊ฑฐ์‚ฌ๋‹˜', '์‹ ๋ถ€๋‹˜', '๋ชฉ์‚ฌ๋‹˜', '์žฅ๋กœ๋‹˜', '์ง‘์‚ฌ๋‹˜',
'์ „๋„์‚ฌ๋‹˜', '์ˆ˜๋…€๋‹˜', '๊ตํ™ฉ๋‹˜', '์ฃผ๊ต๋‹˜',
# Confucian/scholarly
'๋ถ€์ž', '์„ ์ƒ', '๋Œ€์ธ', '์–ด๋ฅธ', '์–ด๋ฅด์‹ ', '์กด์ž', 'ํ˜„์ž', '๊ตฐ์ž', '๋Œ€๋ถ€',
'ํ•™์‚ฌ', '์ง„์‚ฌ', '๋ฌธํ•˜์ƒ', '์ œ์ž', '์œ ์ƒ', '์„ ๋น„',
# Kinship honorifics
'์–ด๋ฅด์‹ ', 'ํ• ์•„๋ฒ„๋‹˜', 'ํ• ๋จธ๋‹˜', '์•„๋ฒ„๋‹˜', '์–ด๋จธ๋‹˜', 'ํ˜•๋‹˜', '๋ˆ„๋‹˜',
'์•„์ฃผ๋ฒ„๋‹˜', '์•„์ฃผ๋จธ๋‹˜', '์‚ผ์ดŒ', '์ด๋ชจ๋‹˜', '๊ณ ๋ชจ๋‹˜', '์™ธ์‚ผ์ดŒ', '์žฅ์ธ์–ด๋ฅธ',
'์žฅ๋ชจ๋‹˜', '์‹œ์•„๋ฒ„๋‹˜', '์‹œ์–ด๋จธ๋‹˜', '์ฒ˜๋‚จ', '์ฒ˜ํ˜•', '๋งคํ˜•', '์†๋‹˜',
'์‚ฌ๋ˆ', '๋ฐฑ๋ถ€๋‹˜', '์ˆ™๋ถ€๋‹˜',
# Verb-based honorific endings and speech levels (expanded)
'์Šต๋‹ˆ๋‹ค', 'ใ…‚๋‹ˆ๋‹ค', '์Šต๋‹ˆ๊นŒ', 'ใ…‚๋‹ˆ๊นŒ', '์‹œ๋‹ค', '์„ธ์š”', '์…”์š”', '์‹ญ์‹œ์˜ค', '์‹œ์˜ค',
'์ด์—์š”', '์˜ˆ์š”', '์ด์˜ˆ์š”', '์—์š”', '์–ด์š”', '์•„์š”', '์—ฌ์š”', 'ํ•ด์š”', '์ด์„ธ์š”', '์œผ์„ธ์š”',
'์œผ์‹œ', '์‹œ', '์œผ์‹ญ๋‹ˆ๋‹ค', '์‹ญ๋‹ˆ๋‹ค', '์œผ์‹ญ๋‹ˆ๊นŒ', '์‹ญ๋‹ˆ๊นŒ', '์œผ์…จ', '์…จ',
'๋“œ๋ฆฝ๋‹ˆ๋‹ค', '๋“œ๋ ค์š”', '๋“œ๋ฆด๊ฒŒ์š”', '๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค', '์˜ฌ๋ฆฝ๋‹ˆ๋‹ค', '์˜ฌ๋ ค์š”',
'์‚ฌ์˜ต๋‹ˆ๋‹ค', '์‚ฌ๋ขฐ', '์—ฌ์ญ™๋‹ˆ๋‹ค', '์—ฌ์ญค์š”', '์•„๋ขฐ', '๋ต™๋‹ˆ๋‹ค', '๋ตˆ์š”', '๋ชจ์‹ญ๋‹ˆ๋‹ค',
'์‹œ์ง€์š”', '์‹œ์ฃ ', '์‹œ๋„ค์š”', '์‹œ๋Š”๊ตฐ์š”', '์‹œ๋Š”๊ตฌ๋‚˜', '์œผ์‹ค', '์‹ค',
'๋“œ์‹œ๋‹ค', '์žก์ˆ˜์‹œ๋‹ค', '์ฃผ๋ฌด์‹œ๋‹ค', '๊ณ„์‹œ๋‹ค', '๊ฐ€์‹œ๋‹ค', '์˜ค์‹œ๋‹ค',
# Common verb endings with ์žˆ๋‹ค/์—†๋‹ค/ํ•˜๋‹ค
'์žˆ์–ด์š”', '์žˆ์Šต๋‹ˆ๋‹ค', '์žˆ์œผ์„ธ์š”', '์žˆ์œผ์‹ญ๋‹ˆ๊นŒ', '์—†์–ด์š”', '์—†์Šต๋‹ˆ๋‹ค', '์—†์œผ์„ธ์š”',
'ํ•ด์š”', 'ํ•ฉ๋‹ˆ๋‹ค', 'ํ•˜์„ธ์š”', 'ํ•˜์‹ญ์‹œ์˜ค', 'ํ•˜์‹œ์ฃ ', 'ํ•˜์‹œ๋„ค์š”', 'ํ–ˆ์–ด์š”', 'ํ–ˆ์Šต๋‹ˆ๋‹ค',
'๋˜์„ธ์š”', '๋˜์…จ์–ด์š”', '๋˜์‹ญ๋‹ˆ๋‹ค', '๋ฉ๋‹ˆ๋‹ค', '๋˜์š”', '๋ผ์š”',
'์ด์•ผ', '์ด๋„ค', '์ด๊ตฌ๋‚˜', '์ด๊ตฐ', '์ด๋„ค์š”', '์ธ๊ฐ€์š”', '์ธ๊ฐ€', '์ผ๊นŒ์š”', '์ผ๊นŒ',
'๊ฑฐ์˜ˆ์š”', '๊ฑฐ์—์š”', '๊ฒ๋‹ˆ๋‹ค', '๊ฑด๊ฐ€์š”', '๊ฒŒ์š”', '์„๊ฒŒ์š”', '์„๊นŒ์š”', '์—ˆ์–ด์š”', '์—ˆ์Šต๋‹ˆ๋‹ค',
'๊ฒ ์Šต๋‹ˆ๋‹ค', '๊ฒ ์–ด์š”', '๊ฒ ๋„ค์š”', '์„๊ฒ๋‹ˆ๋‹ค', '์„๊ฑฐ์˜ˆ์š”', '์„๊ฑฐ์—์š”',
# Common endings
'์š”', '์ฃ ', '๋„ค์š”', '๋Š”๋ฐ์š”', '๊ฑฐ๋“ ์š”', '๋‹ˆ๊นŒ', '์œผ๋‹ˆ๊นŒ', '๋Š”๊ฑธ์š”', '๊ตฐ์š”', '๊ตฌ๋‚˜',
'๋Š”๊ตฌ๋‚˜', '๋Š”๊ตฐ์š”', '๋”๋ผ๊ณ ์š”', '๋”๊ตฐ์š”', '๋˜๋ฐ์š”', '๋‚˜์š”', '๊ฐ€์š”', '๊นŒ์š”',
'๋ผ๊ณ ์š”', '๋‹ค๊ณ ์š”', '๋ƒ๊ณ ์š”', '์ž๊ณ ์š”', '๋ž€๋‹ค', '๋‹จ๋‹ค', '๋ƒ”๋‹ค', '์ž”๋‹ค',
# Formal archaic endings
'๋‚˜์ด๋‹ค', '์‚ฌ์˜ต๋‚˜์ด๋‹ค', '์˜ต๋‹ˆ๋‹ค', '์˜ค', '์†Œ์„œ', '์œผ์˜ค', '์œผ์˜ต์†Œ์„œ', '์‚ฌ์ด๋‹ค',
'์œผ์‹œ์˜ต๋‹ˆ๋‹ค', '์‹œ์˜ต๋‹ˆ๋‹ค', '์œผ์‹œ์˜ต๋‹ˆ๊นŒ', '์‹œ์˜ต๋‹ˆ๊นŒ', '๋‚˜์ด๊นŒ', '๋ฆฌ์ด๊นŒ', '๋ฆฌ์ด๋‹ค',
'์˜ต์†Œ์„œ', '์œผ์†Œ์„œ', '์†Œ์ด๋‹ค', '๋กœ์†Œ์ด๋‹ค', '์ด์˜ต๋‹ˆ๋‹ค', '์ด์˜ฌ์‹œ๋‹ค', 'ํ•˜์˜ต๋‹ˆ๋‹ค'
],
'japanese': [
# Modern honorifics
'ใ•ใ‚“', 'ใกใ‚ƒใ‚“', 'ๅ›', 'ใใ‚“', 'ๆง˜', 'ใ•ใพ', 'ๅ…ˆ็”Ÿ', 'ใ›ใ‚“ใ›ใ„', 'ๆฎฟ', 'ใฉใฎ', 'ๅ…ˆ่ผฉ', 'ใ›ใ‚“ใฑใ„',
# Classical/historical
'ๆฐ', 'ใ—', 'ๆœ่‡ฃ', 'ใ‚ใใ‚“', 'ๅฎฟ็ฆฐ', 'ใ™ใใญ', '้€ฃ', 'ใ‚€ใ‚‰ใ˜', '่‡ฃ', 'ใŠใฟ', 'ๅ›', 'ใใฟ',
'็œŸไบบ', 'ใพใฒใจ', '้“ๅธซ', 'ใฟใกใฎใ—', '็จฒ็ฝฎ', 'ใ„ใชใŽ', '็›ด', 'ใ‚ใŸใ„', '้€ ', 'ใฟใ‚„ใคใ“',
# Court titles
'ๅฟ', 'ใใ‚‡ใ†', 'ๅคงๅคซ', 'ใŸใ„ใต', '้ƒŽ', 'ใ‚ใ†', 'ๅฒ', 'ใ—', 'ไธปๅ…ธ', 'ใ•ใ‹ใ‚“',
# Buddhist titles
'ๅ’Œๅฐš', 'ใŠใ—ใ‚‡ใ†', '็ฆ…ๅธซ', 'ใœใ‚“ใ˜', 'ไธŠไบบ', 'ใ—ใ‚‡ใ†ใซใ‚“', '่–ไบบ', 'ใ—ใ‚‡ใ†ใซใ‚“',
'ๆณ•ๅธซ', 'ใปใ†ใ—', '้˜ฟ้—ๆขจ', 'ใ‚ใ˜ใ‚ƒใ‚Š', 'ๅคงๅ’Œๅฐš', 'ใ ใ„ใŠใ—ใ‚‡ใ†',
# Shinto titles
'ๅคงๅฎฎๅธ', 'ใ ใ„ใใ†ใ˜', 'ๅฎฎๅธ', 'ใใ†ใ˜', '็ฆฐๅฎœ', 'ใญใŽ', '็ฅ', 'ใฏใตใ‚Š',
# Samurai era
'ๅฎˆ', 'ใ‹ใฟ', 'ไป‹', 'ใ™ใ‘', 'ๆŽพ', 'ใ˜ใ‚‡ใ†', '็›ฎ', 'ใ•ใ‹ใ‚“', 'ไธž', 'ใ˜ใ‚‡ใ†',
# Keigo (honorific language) verb forms
'ใงใ™', 'ใพใ™', 'ใ”ใ–ใ„ใพใ™', 'ใ„ใ‚‰ใฃใ—ใ‚ƒใ‚‹', 'ใ„ใ‚‰ใฃใ—ใ‚ƒใ„ใพใ™', 'ใŠใฃใ—ใ‚ƒใ‚‹', 'ใŠใฃใ—ใ‚ƒใ„ใพใ™',
'ใชใ•ใ‚‹', 'ใชใ•ใ„ใพใ™', 'ใใ ใ•ใ‚‹', 'ใใ ใ•ใ„ใพใ™', 'ใ„ใŸใ ใ', 'ใ„ใŸใ ใใพใ™',
'ใŠใ‚Šใพใ™', 'ใงใ”ใ–ใ„ใพใ™', 'ใ”ใ–ใ„ใพใ›ใ‚“', 'ใ„ใŸใ—ใพใ™', 'ใ„ใŸใ—ใพใ—ใŸ',
'็”ณใ™', '็”ณใ—ใพใ™', '็”ณใ—ไธŠใ’ใ‚‹', '็”ณใ—ไธŠใ’ใพใ™', 'ๅญ˜ใ˜ใ‚‹', 'ๅญ˜ใ˜ใพใ™', 'ๅญ˜ใ˜ไธŠใ’ใ‚‹',
'ไผบใ†', 'ไผบใ„ใพใ™', 'ๅ‚ใ‚‹', 'ๅ‚ใ‚Šใพใ™', 'ใŠ็›ฎใซใ‹ใ‹ใ‚‹', 'ใŠ็›ฎใซใ‹ใ‹ใ‚Šใพใ™',
'ๆ‹่ฆ‹', 'ๆ‹่ฆ‹ใ—ใพใ™', 'ๆ‹่ด', 'ๆ‹่ดใ—ใพใ™', 'ๆ‰ฟใ‚‹', 'ๆ‰ฟใ‚Šใพใ™',
# Respectful prefixes/suffixes
'ใŠ', 'ใ”', 'ๅพก', 'ใฟ', '็พŽ', '่ฒด', 'ๅฐŠ'
],
'chinese': [
# Modern forms
'ๅ…ˆ็”Ÿ', 'ๅฐๅง', 'ๅคซไบบ', 'ๅ…ฌๅญ', 'ๅคงไบบ', '่€ๅธˆ', 'ๅธˆ็ˆถ', 'ๅธˆๅ‚…', 'ๅŒๅฟ—', 'ๅŒๅญฆ',
# Ancient/classical forms
'ๅญ', 'ไธˆ', '็ฟ', 'ๅ…ฌ', 'ไพฏ', 'ไผฏ', 'ๅ”', 'ไปฒ', 'ๅญฃ', '็ˆถ', '็”ซ', 'ๅฟ', 'ๅ›', '็”Ÿ',
# Imperial court
'้™›ไธ‹', 'ๆฎฟไธ‹', 'ๅƒๅฒ', 'ไธ‡ๅฒ', 'ๅœฃไธŠ', '็š‡ไธŠ', 'ๅคฉๅญ', '่‡ณๅฐŠ', 'ๅพกๅ‰', '็ˆท',
# Nobility/officials
'้˜ไธ‹', 'ๅคงไบบ', '่€็ˆท', '็›ธๅ…ฌ', 'ๅฎ˜ไบบ', '้ƒŽๅ›', 'ๅจ˜ๅญ', 'ๅคซๅญ', '่ถณไธ‹',
# Religious titles
'ไธŠไบบ', 'ๆณ•ๅธˆ', '็ฆ…ๅธˆ', 'ๅคงๅธˆ', '้ซ˜ๅƒง', 'ๅœฃๅƒง', '็ฅžๅƒง', 'ๆดปไฝ›', 'ไปๆณขๅˆ‡',
'็œŸไบบ', 'ๅคฉๅธˆ', '้“้•ฟ', '้“ๅ‹', 'ไป™้•ฟ', 'ไธŠไป™', '็ฅ–ๅธˆ', 'ๆŽŒๆ•™',
# Scholarly/Confucian
'ๅคซๅญ', 'ๅœฃไบบ', '่ดคไบบ', 'ๅ›ๅญ', 'ๅคงๅ„’', '้ธฟๅ„’', 'ๅฎ—ๅธˆ', 'ๆณฐๆ–—', 'ๅทจๆ“˜',
# Martial arts
'ไพ ๅฃซ', 'ๅคงไพ ', 'ๅฐ‘ไพ ', 'ๅฅณไพ ', '่‹ฑ้›„', '่ฑชๆฐ', 'ๅฃฎๅฃซ', 'ไน‰ๅฃซ',
# Family/kinship
'ไปคๅฐŠ', 'ไปคๅ ‚', 'ไปค้ƒŽ', 'ไปค็ˆฑ', '่ดคๅผŸ', '่ดคไพ„', 'ๆ„šๅ…„', 'ๅฐๅผŸ', 'ๅฎถ็ˆถ', 'ๅฎถๆฏ',
# Humble forms
'ๅœจไธ‹', 'ๅฐไบบ', '้„™ไบบ', 'ไธๆ‰', 'ๆ„š', 'ๆŸ', 'ไป†', 'ๅฆพ', 'ๅฅด', 'ๅฉข',
# Polite verbal markers
'่ฏท', '่ฏท้—ฎ', 'ๆ•ข้—ฎ', 'ๆญ่ฏท', 'ๆ•ฌ่ฏท', '็ƒฆ่ฏท', 'ๆœ‰่ฏท', '่ฏทๆ•™', '่ตๆ•™',
'ๆƒ ้กพ', 'ๆƒ ่ต', 'ๆƒ ๅญ˜', '็ฌ‘็บณ', '้›…ๆญฃ', 'ๆŒ‡ๆญฃ', 'ๆ–งๆญฃ', 'ๅž‚่ฏข',
'ๆ‹œ', 'ๆ‹œ่ง', 'ๆ‹œ่ฎฟ', 'ๆ‹œ่ฏป', 'ๆ‹œๆ‰˜', 'ๆ‹œ่ฐข', 'ๆ•ฌไธŠ', '่ฐจไธŠ', '้กฟ้ฆ–'
],
'english': [
# Modern Korean romanizations (Revised Romanization of Korean - 2000)
'-nim', '-ssi', '-seonbae', '-hubae', '-donggi', '-hyeong', '-nuna',
'-eonni', '-oppa', '-dongsaeng', '-seonsaengnim', '-gyosunim',
'-baksanim', '-sajangnim', '-hoejangnim', '-bujangnim', '-gwajangnim',
'-daerim', '-timjangnim', '-siljangnim', '-isanim', '-jeonmunim',
'-sangmunim', '-busajangnim', '-gomunnim',
# Classical/formal Korean romanizations
'-gong', '-ong', '-gun', '-yang', '-nang', '-rang', '-saeng', '-ja',
'-bu', '-mo', '-si', '-je', '-jokha',
# Royal/noble Korean romanizations
'-mama', '-manora', '-daegam', '-yeonggam', '-nari', '-doryeong',
'-nangja', '-assi', '-gyusu', '-gakha', '-jeonha', '-pyeha', '-jeoha',
'-hapka', '-daebi', '-daewang', '-wangja', '-gongju',
# Buddhist/religious Korean romanizations
'-seunim', '-sabunim', '-josanim', '-keunseunim', '-hwasang',
'-daedeok', '-daesa', '-beopsa', '-seonsa', '-yulsa', '-bosalnim',
'-geosanim', '-sinbunim', '-moksanim', '-jangnonim', '-jipsanim',
# Confucian/scholarly Korean romanizations
'-buja', '-seonsaeng', '-daein', '-eoreun', '-eoreusin', '-jonja',
'-hyeonja', '-gunja', '-daebu', '-haksa', '-jinsa', '-munhasaeng', '-jeja',
# Kinship Korean romanizations
'-harabeonim', '-halmeonim', '-abeonim', '-eomeonim', '-hyeongnim',
'-nunim', '-ajubeonim', '-ajumeonim', '-samchon', '-imonim', '-gomonim',
'-oesamchon', '-jangineoreun', '-jangmonim', '-siabeonim', '-sieomeonim',
'-cheonam', '-cheohyeong', '-maehyeong', '-sonnim',
# Korean verb endings romanized (Revised Romanization)
'-seumnida', '-mnida', '-seumnikka', '-mnikka', '-sida', '-seyo',
'-syeoyo', '-sipsio', '-sio', '-ieyo', '-yeyo', '-iyeyo', '-eyo',
'-eoyo', '-ayo', '-yeoyo', '-haeyo', '-iseyo', '-euseyo',
'-eusi', '-si', '-eusimnida', '-simnida', '-eusimnikka', '-simnikka',
'-eusyeot', '-syeot', '-deurimnida', '-deuryeoyo', '-deurilgeyo',
'-deurigesseumnida', '-ollimnida', '-ollyeoyo', '-saomnida', '-saroe',
'-yeojjumnida', '-yeojjwoyo', '-aroe', '-boemnida', '-boeyo', '-mosimnida',
'-sijiyo', '-sijyo', '-sineyo', '-sineungunyo', '-sineunguna', '-eusil', '-sil',
'-deusida', '-japsusida', '-jumusida', '-gyesida', '-gasida', '-osida',
# Common Korean verb endings romanized
'-isseoyo', '-isseumnida', '-isseuseyo', '-isseusimnikka',
'-eopseoyo', '-eopseumnida', '-eopseuseyo', '-hamnida', '-haseyo',
'-hasipsio', '-hasijyo', '-hasineyo', '-haesseoyo', '-haesseumnida',
'-doeseyo', '-doesyeosseoyo', '-doesimnida', '-doemnida', '-doeyo', '-dwaeyo',
'-iya', '-ine', '-iguna', '-igun', '-ineyo', '-ingayo', '-inga',
'-ilkkayo', '-ilkka', '-geoyeyo', '-geoeyo', '-geomnida', '-geongayo',
'-geyo', '-eulgeyo', '-eulkkayo', '-eosseoyo', '-eosseumnida',
'-gesseumnida', '-gesseoyo', '-genneyo', '-eulgeommida', '-eulgeoyeyo', '-eulgeoeyo',
# Common Korean endings romanized
'-yo', '-jyo', '-neyo', '-neundeyo', '-geodeunyo', '-nikka',
'-eunikka', '-neungeolyo', '-gunyo', '-guna', '-neunguna', '-neungunyo',
'-deoragoyo', '-deogunyo', '-deondeyo', '-nayo', '-gayo', '-kkayo',
'-ragoyo', '-dagoyo', '-nyagoyo', '-jagoyo', '-randa', '-danda',
'-nyanda', '-janda',
# Formal archaic Korean romanized
'-naida', '-saomnaida', '-omnida', '-o', '-soseo', '-euo',
'-euopsoseo', '-saida', '-eusiomnida', '-siomnida', '-eusiomnikka',
'-siomnikka', '-naikka', '-riikka', '-riida', '-opsoseo', '-eusoseo',
'-soida', '-rosoida', '-iomnida', '-iolsida', '-haomnida',
# Japanese keigo romanized (keeping existing)
'-san', '-chan', '-kun', '-sama', '-sensei', '-senpai', '-dono',
'-shi', '-tan', '-chin', '-desu', '-masu', '-gozaimasu',
'-irassharu', '-irasshaimasu', '-ossharu', '-osshaimasu',
'-nasaru', '-nasaimasu', '-kudasaru', '-kudasaimasu', '-itadaku',
'-itadakimasu', '-orimasu', '-degozaimasu', '-gozaimasen',
'-itashimasu', '-itashimashita', '-mousu', '-moushimasu',
'-moushiageru', '-moushiagemasu', '-zonjiru', '-zonjimasu',
'-ukagau', '-ukagaimasu', '-mairu', '-mairimasu', '-haiken',
'-haikenshimasu',
# Chinese romanizations (keeping existing)
'-xiong', '-di', '-ge', '-gege', '-didi', '-jie', '-jiejie',
'-meimei', '-shixiong', '-shidi', '-shijie', '-shimei', '-gongzi',
'-guniang', '-xiaojie', '-daren', '-qianbei', '-daoyou', '-zhanglao',
'-shibo', '-shishu', '-shifu', '-laoshi', '-xiansheng', '-daxia',
'-shaoxia', '-nvxia', '-jushi', '-shanren', '-dazhang', '-zhenren',
'benzuo', 'bengong', 'benwang', 'benshao', 'zhen', 'gu', 'laozi', 'zaixia',
'pindao', 'xiaodao', 'nucai', 'chen', 'qie', 'wanbei',
'bixia', 'dianxia', 'niangniang', 'laoda', 'laoban', 'zhanggui', 'xiaoer',
'shizhu',
# Ancient Chinese romanizations
'-zi', '-gong', '-hou', '-bo', '-jun', '-qing', '-weng', '-fu',
'-sheng', '-lang', '-langjun', '-niangzi', '-furen', '-gege',
'-jiejie', '-yeye', '-nainai',
# Chinese politeness markers romanized
'-qing', '-jing', '-gong', '-hui', '-ci', '-bai', '-gan', '-chui',
'qingwen', 'ganwen', 'gongjing', 'jingjing', 'baijian', 'baifang',
'baituo'
]
}
TITLE_PATTERNS = {
'korean': [
# Modern titles
r'\b(์™•|์—ฌ์™•|์™•์ž|๊ณต์ฃผ|ํ™ฉ์ œ|ํ™ฉํ›„|๋Œ€์™•|๋Œ€๊ณต|๊ณต์ž‘|๋ฐฑ์ž‘|์ž์ž‘|๋‚จ์ž‘|๊ธฐ์‚ฌ|์žฅ๊ตฐ|๋Œ€์žฅ|์›์ˆ˜|์ œ๋…|ํ•จ์žฅ|๋Œ€์‹ |์žฌ์ƒ|์ด๋ฆฌ|๋Œ€ํ†ต๋ น|์‹œ์žฅ|์ง€์‚ฌ|๊ฒ€์‚ฌ|ํŒ์‚ฌ|๋ณ€ํ˜ธ์‚ฌ|์˜์‚ฌ|๋ฐ•์‚ฌ|๊ต์ˆ˜|์‹ ๋ถ€|๋ชฉ์‚ฌ|์Šค๋‹˜|๋„์‚ฌ)\b',
r'\b(ํํ•˜|์ „ํ•˜|๊ฐํ•˜|์˜ˆํ•˜|๋‹˜|๋Œ€๊ฐ|์˜๊ฐ|๋‚˜๋ฆฌ|๋„๋ จ๋‹˜|์•„๊ฐ€์”จ|๋ถ€์ธ|์„ ์ƒ)\b',
# Historical/classical titles
r'\b(๋Œ€์™•|ํƒœ์™•|์™•๋น„|์™•ํ›„|์„ธ์ž|์„ธ์ž๋นˆ|๋Œ€๊ตฐ|๊ตฐ|์˜น์ฃผ|๊ณต์ฃผ|๋ถ€๋งˆ|์›์ž|์›์†)\b',
r'\b(์˜์˜์ •|์ขŒ์˜์ •|์šฐ์˜์ •|ํŒ์„œ|์ฐธํŒ|์ฐธ์˜|์ •์Šน|ํŒ์‚ฌ|์‚ฌ๋˜|ํ˜„๋ น|๊ตฐ์ˆ˜|๋ชฉ์‚ฌ|๋ถ€์‚ฌ)\b',
r'\b(๋Œ€์ œํ•™|์ œํ•™|๋Œ€์‚ฌ๊ฐ„|์‚ฌ๊ฐ„|๋Œ€์‚ฌํ—Œ|์‚ฌํ—Œ|๋„์Šน์ง€|์Šน์ง€|ํ•œ๋ฆผ|์‚ฌ๊ด€|๋‚ด์‹œ|ํ™˜๊ด€)\b',
r'\b(๋ณ‘์กฐํŒ์„œ|์ด์กฐํŒ์„œ|ํ˜ธ์กฐํŒ์„œ|์˜ˆ์กฐํŒ์„œ|ํ˜•์กฐํŒ์„œ|๊ณต์กฐํŒ์„œ)\b',
r'\b(๋„์›์ˆ˜|๋ถ€์›์ˆ˜|๋ณ‘๋งˆ์ ˆ๋„์‚ฌ|์ˆ˜๊ตฐ์ ˆ๋„์‚ฌ|์ฒจ์ ˆ์ œ์‚ฌ|๋งŒํ˜ธ|์ฒœํ˜ธ|๋ฐฑํ˜ธ)\b',
r'\b(์ •์ผํ’ˆ|์ข…์ผํ’ˆ|์ •์ดํ’ˆ|์ข…์ดํ’ˆ|์ •์‚ผํ’ˆ|์ข…์‚ผํ’ˆ|์ •์‚ฌํ’ˆ|์ข…์‚ฌํ’ˆ|์ •์˜คํ’ˆ|์ข…์˜คํ’ˆ)\b',
# Korean honorific verb endings patterns
r'(์Šต๋‹ˆ๋‹ค|ใ…‚๋‹ˆ๋‹ค|์Šต๋‹ˆ๊นŒ|ใ…‚๋‹ˆ๊นŒ|์„ธ์š”|์…”์š”|์‹ญ์‹œ์˜ค|์‹œ์˜ค)$',
r'(์ด์—์š”|์˜ˆ์š”|์ด์˜ˆ์š”|์—์š”|์–ด์š”|์•„์š”|์—ฌ์š”|ํ•ด์š”)$',
r'(์œผ์‹œ|์‹œ)(์—ˆ|๊ฒ |ใ„น|์„|๋Š”|๋˜)*(์Šต๋‹ˆ๋‹ค|ใ…‚๋‹ˆ๋‹ค|์–ด์š”|์•„์š”|์„ธ์š”)',
r'(๋“œ๋ฆฝ๋‹ˆ๋‹ค|๋“œ๋ ค์š”|๋“œ๋ฆด๊ฒŒ์š”|๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค|์˜ฌ๋ฆฝ๋‹ˆ๋‹ค|์˜ฌ๋ ค์š”)$',
r'(์‚ฌ์˜ต๋‹ˆ๋‹ค|์—ฌ์ญ™๋‹ˆ๋‹ค|์—ฌ์ญค์š”|๋ต™๋‹ˆ๋‹ค|๋ตˆ์š”|๋ชจ์‹ญ๋‹ˆ๋‹ค)$',
r'(๋‚˜์ด๋‹ค|์‚ฌ์˜ต๋‚˜์ด๋‹ค|์˜ต๋‹ˆ๋‹ค|์œผ์˜ค|์œผ์˜ต์†Œ์„œ|์‚ฌ์ด๋‹ค)$'
],
'japanese': [
# Modern titles
r'\b(็Ž‹|ๅฅณ็Ž‹|็Ž‹ๅญ|ๅงซ|็š‡ๅธ|็š‡ๅŽ|ๅคฉ็š‡|็š‡ๅคชๅญ|ๅคง็Ž‹|ๅคงๅ…ฌ|ๅ…ฌ็ˆต|ไผฏ็ˆต|ๅญ็ˆต|็”ท็ˆต|้จŽๅฃซ|ๅฐ†่ป|ๅคงๅฐ†|ๅ…ƒๅธฅ|ๆ็ฃ|่‰ฆ้•ท|ๅคง่‡ฃ|ๅฎฐ็›ธ|็ท็†|ๅคง็ตฑ้ ˜|ๅธ‚้•ท|็Ÿฅไบ‹|ๆคœไบ‹|่ฃๅˆคๅฎ˜|ๅผ่ญทๅฃซ|ๅŒป่€…|ๅšๅฃซ|ๆ•™ๆŽˆ|็ฅž็ˆถ|็‰งๅธซ|ๅƒงไพถ|้“ๅฃซ)\b',
r'\b(้™›ไธ‹|ๆฎฟไธ‹|้–ฃไธ‹|็ŒŠไธ‹|ๆง˜|ๅคงไบบ|ๆฎฟ|ๅฟ|ๅ›|ๆฐ)\b',
# Historical titles
r'\b(ๅคฉ็š‡|็š‡ๅŽ|็š‡ๅคชๅญ|่ฆช็Ž‹|ๅ†…่ฆช็Ž‹|็Ž‹|ๅฅณ็Ž‹|ๅคชๆ”ฟๅคง่‡ฃ|ๅทฆๅคง่‡ฃ|ๅณๅคง่‡ฃ|ๅ†…ๅคง่‡ฃ|ๅคง็ด่จ€|ไธญ็ด่จ€|ๅ‚่ญฐ)\b',
r'\b(้–ข็™ฝ|ๆ‘‚ๆ”ฟ|ๅพๅคทๅคงๅฐ†่ป|็ฎก้ ˜|ๅŸทๆจฉ|ๅฎˆ่ญท|ๅœฐ้ ญ|ไปฃๅฎ˜|ๅฅ‰่กŒ|ไธŽๅŠ›|ๅŒๅฟƒ)\b',
r'\b(ๅคชๆ”ฟๅฎ˜|็ฅž็ฅ‡ๅฎ˜|ๅผ้ƒจ็œ|ๆฒป้ƒจ็œ|ๆฐ‘้ƒจ็œ|ๅ…ต้ƒจ็œ|ๅˆ‘้ƒจ็œ|ๅคง่”ต็œ|ๅฎฎๅ†…็œ)\b',
r'\b(ๅคงๅƒงๆญฃ|ๅƒงๆญฃ|ๅคงๅƒง้ƒฝ|ๅƒง้ƒฝ|ๅพ‹ๅธซ|ๅคงๆณ•ๅธซ|ๆณ•ๅธซ|ๅคง็ฆ…ๅธซ|็ฆ…ๅธซ)\b',
r'\b(ๆญฃไธ€ไฝ|ๅพ“ไธ€ไฝ|ๆญฃไบŒไฝ|ๅพ“ไบŒไฝ|ๆญฃไธ‰ไฝ|ๅพ“ไธ‰ไฝ|ๆญฃๅ››ไฝ|ๅพ“ๅ››ไฝ|ๆญฃไบ”ไฝ|ๅพ“ไบ”ไฝ)\b',
r'\b(ๅคงๅ’Œๅฎˆ|ๅฑฑๅŸŽๅฎˆ|ๆ‘‚ๆดฅๅฎˆ|ๆฒณๅ†…ๅฎˆ|ๅ’Œๆณ‰ๅฎˆ|ไผŠ่ณ€ๅฎˆ|ไผŠๅ‹ขๅฎˆ|ๅฐพๅผตๅฎˆ|ไธ‰ๆฒณๅฎˆ|้ ๆฑŸๅฎˆ)\b',
# Japanese keigo (honorific language) patterns
r'(ใงใ™|ใพใ™|ใ”ใ–ใ„ใพใ™)$',
r'(ใ„ใ‚‰ใฃใ—ใ‚ƒ|ใŠใฃใ—ใ‚ƒ|ใชใ•|ใใ ใ•)(ใ„ใพใ™|ใ„ใพใ—ใŸ|ใ‚‹|ใฃใŸ)$',
r'(ใ„ใŸใ |ใŠ|ใ”|ๅพก)(ใ|ใใพใ™|ใใพใ—ใŸ|ใ|ใ‘ใ‚‹|ใ‘ใพใ™)',
r'(็”ณใ—ไธŠใ’|็”ณใ—|ๅญ˜ใ˜ไธŠใ’|ๅญ˜ใ˜|ไผบใ„|ๅ‚ใ‚Š)(ใพใ™|ใพใ—ใŸ|ใ‚‹)$',
r'(ๆ‹่ฆ‹|ๆ‹่ด|ๆ‰ฟใ‚Š|ๆ‰ฟ)(ใ—ใพใ™|ใ—ใพใ—ใŸ|ใ„ใŸใ—ใพใ™|ใ„ใŸใ—ใพใ—ใŸ)$',
r'ใŠ[^ใ‚-ใ‚“]+[ใซใชใ‚‹|ใซใชใ‚Šใพใ™|ใใ ใ•ใ‚‹|ใใ ใ•ใ„ใพใ™]'
],
'chinese': [
# Modern titles
r'\b(็Ž‹|ๅฅณ็Ž‹|็Ž‹ๅญ|ๅ…ฌไธป|็š‡ๅธ|็š‡ๅŽ|ๅคง็Ž‹|ๅคงๅ…ฌ|ๅ…ฌ็ˆต|ไผฏ็ˆต|ๅญ็ˆต|็”ท็ˆต|้ช‘ๅฃซ|ๅฐ†ๅ†›|ๅคงๅฐ†|ๅ…ƒๅธ…|ๆ็ฃ|่ˆฐ้•ฟ|ๅคง่‡ฃ|ๅฎฐ็›ธ|ๆ€ป็†|ๅคงๆ€ป็ปŸ|ๅธ‚้•ฟ|็Ÿฅไบ‹|ๆฃ€ๅฏŸๅฎ˜|ๆณ•ๅฎ˜|ๅพ‹ๅธˆ|ๅŒป็”Ÿ|ๅšๅฃซ|ๆ•™ๆŽˆ|็ฅž็ˆถ|็‰งๅธˆ|ๅ’Œๅฐš|้“ๅฃซ)\b',
r'\b(้™›ไธ‹|ๆฎฟไธ‹|้˜ไธ‹|ๅคงไบบ|่€็ˆท|ๅคซไบบ|ๅฐๅง|ๅ…ฌๅญ|ๅฐ‘็ˆท|ๅง‘ๅจ˜|ๅ…ˆ็”Ÿ)\b',
# Imperial titles
r'\b(ๅคฉๅญ|ๅœฃไธŠ|็š‡ไธŠ|ไธ‡ๅฒ|ไธ‡ๅฒ็ˆท|ๅคชไธŠ็š‡|็š‡ๅคชๅŽ|ๅคชๅŽ|็š‡ๅŽ|่ดตๅฆƒ|ๅฆƒ|ๅซ”|่ดตไบบ|ๅธธๅœจ|็ญ”ๅบ”)\b',
r'\b(ๅคชๅญ|็š‡ๅญ|็š‡ๅญ™|ไบฒ็Ž‹|้ƒก็Ž‹|่ดๅ‹’|่ดๅญ|ๅ…ฌไธป|ๆ ผๆ ผ|้ƒกไธป|ๅŽฟไธป|้ƒกๅ›|ๅŽฟๅ›)\b',
# Ancient official titles
r'\b(ไธž็›ธ|็›ธๅ›ฝ|ๅคชๅธˆ|ๅคชๅ‚…|ๅคชไฟ|ๅคชๅฐ‰|ๅธๅพ’|ๅธ็ฉบ|ๅคงๅธ้ฉฌ|ๅคงๅธๅ†œ|ๅคงๅธๅฏ‡)\b',
r'\b(ๅฐšไนฆ|ไพ้ƒŽ|้ƒŽไธญ|ๅ‘˜ๅค–้ƒŽ|ไธปไบ‹|็Ÿฅๅบœ|็Ÿฅๅทž|็ŸฅๅŽฟ|ๅŒ็Ÿฅ|้€šๅˆค|ๆŽจๅฎ˜|ๅทกๆŠš|ๆ€ป็ฃ)\b',
r'\b(ๅพกๅฒๅคงๅคซ|ๅพกๅฒไธญไธž|็›‘ๅฏŸๅพกๅฒ|็ป™ไบ‹ไธญ|้ƒฝๅฏŸ้™ข|็ฟฐๆž—้™ข|ๅ›ฝๅญ็›‘|้’ฆๅคฉ็›‘)\b',
r'\b(ๅคงๅญฆๅฃซ|ๅญฆๅฃซ|ไพ่ฏป|ไพ่ฎฒ|็ผ–ไฟฎ|ๆฃ€่ฎจ|ๅบถๅ‰ๅฃซ|ไธพไบบ|่ฟ›ๅฃซ|็Šถๅ…ƒ|ๆฆœ็œผ|ๆŽข่Šฑ)\b',
# Military ranks
r'\b(ๅคงๅ…ƒๅธ…|ๅ…ƒๅธ…|ๅคงๅฐ†ๅ†›|ๅฐ†ๅ†›|้ƒฝ็ฃ|้ƒฝๆŒ‡ๆŒฅไฝฟ|ๆŒ‡ๆŒฅไฝฟ|ๅƒๆˆท|็™พๆˆท|ๆ€ปๅ…ต|ๅ‰ฏๅฐ†|ๅ‚ๅฐ†|ๆธธๅ‡ป|้ƒฝๅธ|ๅฎˆๅค‡)\b',
r'\b(ๆ็ฃ|ๆ€ปๅ…ตๅฎ˜|ๅ‰ฏๆ€ปๅ…ต|ๅ‚ๅฐ†|ๆธธๅ‡ปๅฐ†ๅ†›|้ƒฝๅธ|ๅฎˆๅค‡|ๅƒๆ€ป|ๆŠŠๆ€ป|ๅค–ๅง”)\b',
# Religious titles
r'\b(ๅ›ฝๅธˆ|ๅธๅธˆ|ๆณ•็Ž‹|ๆดปไฝ›|ๅ ชๅธƒ|ไปๆณขๅˆ‡|ๅคงๅ’Œๅฐš|ๆ–นไธˆ|ไฝๆŒ|้ฆ–ๅบง|็ปด้‚ฃ|็Ÿฅๅฎข)\b',
r'\b(ๅคฉๅธˆ|็œŸไบบ|้“้•ฟ|ๆŽŒๆ•™|็›‘้™ข|้ซ˜ๅŠŸ|้ƒฝ่ฎฒ|ๆ€ป็†|ๆ็‚น|็Ÿฅ่ง‚)\b',
# Nobility ranks
r'\b(ๅ…ฌ|ไพฏ|ไผฏ|ๅญ|็”ท|ๅผ€ๅ›ฝๅ…ฌ|้ƒกๅ…ฌ|ๅ›ฝๅ…ฌ|้ƒกไพฏ|ๅŽฟไพฏ|้ƒกไผฏ|ๅŽฟไผฏ|ๅŽฟๅญ|ๅŽฟ็”ท)\b',
r'\b(ไธ€ๅ“|ไบŒๅ“|ไธ‰ๅ“|ๅ››ๅ“|ไบ”ๅ“|ๅ…ญๅ“|ไธƒๅ“|ๅ…ซๅ“|ไนๅ“|ๆญฃไธ€ๅ“|ไปŽไธ€ๅ“|ๆญฃไบŒๅ“|ไปŽไบŒๅ“)\b',
# Chinese politeness markers
r'(่ฏท|ๆ•ข|ๆญ|ๆ•ฌ|็ƒฆ|ๆœ‰)(้—ฎ|่ฏท|่ต|ๆ•™|ๅ‘Š|็คบ)',
r'(ๆ‹œ|ๆƒ |่ต|ๅž‚|้›…|็ฌ‘)(่ง|่ฎฟ|่ฏป|ๆ‰˜|่ฐข|้กพ|่ต|ๅญ˜|็บณ|ๆญฃ|่ฏข)',
r'(ๆ•ฌ|่ฐจ|้กฟ)(ไธŠ|ๅ‘ˆ|ๅฏ|็™ฝ|้ฆ–)'
],
'english': [
# Western titles
r'\b(King|Queen|Prince|Princess|Emperor|Empress|Duke|Duchess|Marquis|Marquess|Earl|Count|Countess|Viscount|Viscountess|Baron|Baroness|Knight|Lord|Lady|Sir|Dame|General|Admiral|Captain|Major|Colonel|Commander|Lieutenant|Sergeant|Minister|Chancellor|President|Mayor|Governor|Judge|Doctor|Professor|Father|Reverend|Master|Mistress)\b',
r'\b(His|Her|Your|Their)\s+(Majesty|Highness|Grace|Excellency|Honor|Worship|Lordship|Ladyship)\b',
# Romanized historical titles
r'\b(Tianzi|Huangdi|Huanghou|Taizi|Qinwang|Junwang|Beile|Beizi|Gongzhu|Gege|Bixia|Dianxia|Niangniang|Fuma|Wangye)\b',
r'\b(Chengxiang|Zaixiang|Taishi|Taifu|Taibao|Taiwei|Situ|Sikong|Dasima)\b',
r'\b(Shogun|Daimyo|Samurai|Ronin|Ninja|Tenno|Mikado|Kampaku|Sessho)\b',
r'\b(Taewang|Wangbi|Wanghu|Seja|Daegun|Gun|Ongju|Gongju|Buma)\b'
]
}
# Expanded Chinese numbers including classical forms
# Chinese compound surnames (two-character surnames)
CHINESE_COMPOUND_SURNAMES = {
'ๅธ้ฉฌ', 'ๆฌง้˜ณ', 'ไธŠๅฎ˜', '่ฏธ่‘›', 'ๆ…•ๅฎน', '็š‡็”ซ', 'ๅฐ‰่ฟŸ', 'ๅ…ฌๅญ™',
'่ฝฉ่พ•', 'ไปค็‹', 'ๅ—ๅฎซ', 'ไธœๆ–น', '่ฅฟ้—จ', '็‹ฌๅญค', 'ๅฎŒ้ขœ', '่ตซ่ฟž',
'ๆพนๅฐ', 'ๅ…ฌ็พŠ', '้’Ÿ็ฆป', '้•ฟๅญ™', 'ๅฎ‡ๆ–‡', '็™พ้‡Œ', 'ๅ‘ผๅปถ', 'ไธœ้ƒญ',
'ๅ—้—จ', '็พŠ่ˆŒ', 'ๅพฎ็”Ÿ', 'ๆขไธ˜', 'ๅทฆไธ˜', 'ๆฎตๅนฒ', '็ซฏๆœจ', 'ๅคไพฏ'
}
# Common single-character Chinese surnames
CHINESE_SINGLE_SURNAMES = {
'่ตต', '้’ฑ', 'ๅญ™', 'ๆŽ', 'ๅ‘จ', 'ๅด', '้ƒ‘', '็Ž‹', 'ๅ†ฏ', '้™ˆ',
'่คš', 'ๅซ', '่’‹', 'ๆฒˆ', '้Ÿฉ', 'ๆจ', 'ๆœฑ', '็งฆ', 'ๅฐค', '่ฎธ',
'ไฝ•', 'ๅ•', 'ๆ–ฝ', 'ๅผ ', 'ๅญ”', 'ๆ›น', 'ไธฅ', 'ๅŽ', '้‡‘', '้ญ',
'้™ถ', 'ๅงœ', 'ๆˆš', '่ฐข', '้‚น', 'ๅ–ป', 'ๆŸ', 'ๆฐด', '็ชฆ', '็ซ ',
'ไบ‘', '่‹', 'ๆฝ˜', '่‘›', 'ๅฅš', '่Œƒ', 'ๅฝญ', '้ƒŽ', '้ฒ', '้Ÿฆ',
'ๆ˜Œ', '้ฉฌ', '่‹—', 'ๅ‡ค', '่Šฑ', 'ๆ–น', 'ไฟž', 'ไปป', '่ข', 'ๆŸณ',
'้…†', '้ฒ', 'ๅฒ', 'ๅ”', '่ดน', 'ๅป‰', 'ๅฒ‘', '่–›', '้›ท', '่ดบ',
'ๅ€ช', 'ๆฑค', 'ๆป•', 'ๆฎท', '็ฝ—', 'ๆฏ•', '้ƒ', '้‚ฌ', 'ๅฎ‰', 'ๅธธ',
'ไน', 'ไบŽ', 'ๆ—ถ', 'ๅ‚…', '็šฎ', 'ๅž', '้ฝ', 'ๅบท', 'ไผ', 'ไฝ™',
'ๅ…ƒ', 'ๅœ', '้กพ', 'ๅญŸ', 'ๅนณ', '้ป„', 'ๅ’Œ', '็ฉ†', '่ง', 'ๅฐน',
'ๅงš', '้‚ต', 'ๆน›', 'ๆฑช', '็ฅ', 'ๆฏ›', '็ฆน', '็‹„', '็ฑณ', '่ด',
'ๆ˜Ž', '่‡ง', '่ฎก', 'ไผ', 'ๆˆ', 'ๆˆด', '่ฐˆ', 'ๅฎ‹', '่Œ…', 'ๅบž',
'็†Š', '็บช', '่ˆ’', 'ๅฑˆ', '้กน', '็ฅ', '่‘ฃ', 'ๆข', 'ๆœ', '้˜ฎ',
'่“', '้—ต', 'ๅธญ', 'ๅญฃ', '้บป', 'ๅผบ', '่ดพ', '่ทฏ', 'ๅจ„', 'ๅฑ'
}
# Chinese cultivation/xianxia terms (common in web novels)
CHINESE_CULTIVATION_TERMS = {
'realms': [
'็ปƒๆฐ”', '็ญ‘ๅŸบ', '้‡‘ไธน', 'ๅ…ƒๅฉด', 'ๅŒ–็ฅž', '็‚ผ่™š', 'ๅˆไฝ“', 'ๆธกๅŠซ', 'ๅคงไน˜',
'ๅ‡ๆฐ”', 'ๅผ€ๅ…‰', '่žๅˆ', 'ๅฟƒๅŠจ', '็ตๅฏ‚', 'ๅ‡บ็ช', 'ๅˆ†็ฅž', 'ๅ่™š', 'ๅคฉๅŠซ',
'ๅ…ˆๅคฉ', 'ๅŽๅคฉ', 'ๆญฆๅพ’', 'ๆญฆ่€…', 'ๆญฆๅธˆ', 'ๅคงๆญฆๅธˆ', 'ๆญฆ็ต', 'ๆญฆ็Ž‹', 'ๆญฆ็š‡', 'ๆญฆๅธ', 'ๆญฆๅœฃ',
'ๆ–—ไน‹ๆฐ”', 'ๆ–—่€…', 'ๆ–—ๅธˆ', 'ๅคงๆ–—ๅธˆ', 'ๆ–—็ต', 'ๆ–—็Ž‹', 'ๆ–—็š‡', 'ๆ–—ๅฎ—', 'ๆ–—ๅฐŠ', 'ๆ–—ๅœฃ', 'ๆ–—ๅธ'
],
'techniques': [
'ๅ‰‘่ฏ€', 'ๅฟƒๆณ•', 'ๅŠŸๆณ•', '็ง˜ๆœฏ', '็ฅž้€š', 'ๆณ•ๆœฏ', 'ไป™ๆœฏ', '้“ๆณ•', '้ญ”ๅŠŸ',
'ๅ‰‘ๆณ•', 'ๅˆ€ๆณ•', 'ๆŽŒๆณ•', 'ๆ‹ณๆณ•', 'ๆŒ‡ๆณ•', '่…ฟๆณ•', '่บซๆณ•', 'ๆญฅๆณ•',
'ๅพกๅ‰‘ๆœฏ', 'ๅพกๅ‰‘้ฃž่กŒ', '้ๆœฏ', '้ๆณ•', 'ๅœŸ้', '็ซ้', 'ๆฐด้'
],
'items': [
'ๆณ•ๅฎ', '็ตๅ™จ', 'ไป™ๅ™จ', '็ฅžๅ™จ', 'ๅœฃๅ™จ', '้“ๅ™จ', '้ญ”ๅ™จ',
'ไธน่ฏ', '็ตไธน', 'ไป™ไธน', '็ฅžไธน', '็ต็Ÿณ', '็ตๆ™ถ', 'ไป™็Ÿณ',
'็ต่‰', '็ต่ฏ', 'ไป™่‰', 'ๅคฉๆๅœฐๅฎ', '็ตๅ…ฝ', 'ๅฆ–ๅ…ฝ', 'ๅ‡ถๅ…ฝ'
],
'titles': [
'็œŸไบบ', '้“ๅ‹', 'ๅธˆๅ…„', 'ๅธˆๅง', 'ๅธˆๅผŸ', 'ๅธˆๅฆน', 'ๆŽŒๆ•™', '้•ฟ่€',
'ๅคชไธŠ้•ฟ่€', 'ๅณฐไธป', 'ๆฎฟไธป', 'ๅฎ—ไธป', 'ๆ•™ไธป', '็›Ÿไธป', '้ญ”ๅคด',
'ๆ•ฃไฟฎ', 'ๅ‰‘ไฟฎ', 'ไฝ“ไฟฎ', '็‚ผไธนๅธˆ', '็‚ผๅ™จๅธˆ', '้˜ตๆณ•ๅธˆ', '็ฌฆๅธˆ'
],
'locations': [
'ๆดžๅบœ', 'ๆดžๅคฉ', '็ง˜ๅขƒ', 'ๅฐไธ–็•Œ', '็ฆๅœฐ', 'ๅœฃๅœฐ', '็ฆๅœฐ', '้—่ฟน',
'ๅฑฑ้—จ', 'ไธปๅณฐ', '็ตๅณฐ', '่ฏๅ›ญ', '่—็ป้˜', 'ไผ ๅŠŸๆฎฟ', '็‚ผๅ™จ้˜'
]
}
# Chinese wuxia terms (martial arts novels)
CHINESE_WUXIA_TERMS = {
'skills': [
'่ฝปๅŠŸ', 'ๅ†…ๅŠŸ', 'ๅค–ๅŠŸ', '็กฌๅŠŸ', '่ฝฏๅŠŸ', 'ๆฐ”ๅŠŸ', '็œŸๆฐ”', 'ๅ†…ๅŠ›',
'้™้พ™ๅๅ…ซๆŽŒ', 'ๅ…ญ่„‰็ฅžๅ‰‘', 'ไน้˜ด็œŸ็ป', 'ไน้˜ณ็ฅžๅŠŸ', 'ๆ˜“็ญ‹็ป', '่‘ต่Šฑๅฎๅ…ธ'
],
'sects': [
'ๅฐ‘ๆž—', 'ๆญฆๅฝ“', 'ๅณจ็œ‰', 'ๅŽๅฑฑ', 'ๆ’ๅฑฑ', '่กกๅฑฑ', 'ๅตฉๅฑฑ', 'ๆณฐๅฑฑ',
'ๅ…จ็œŸ', 'ๅคๅข“', 'ๆกƒ่Šฑๅฒ›', 'ไธๅธฎ', 'ๆ˜Žๆ•™', 'ๆ—ฅๆœˆ็ฅžๆ•™', 'ๆ˜Ÿๅฎฟ',
'้—จๆดพ', 'ๆ•™ๆดพ', 'ๅธฎๆดพ', 'ไธ–ๅฎถ', 'ๅฎถๆ—'
],
'ranks': [
'ๆญฆๆž—็›Ÿไธป', 'ไธ€ๆต้ซ˜ๆ‰‹', 'ไบŒๆต้ซ˜ๆ‰‹', 'ไธ‰ๆต้ซ˜ๆ‰‹', '็ป้กถ้ซ˜ๆ‰‹',
'ๅฎ—ๅธˆ', 'ๅคงๅฎ—ๅธˆ', 'ๅ…ˆๅคฉๅฎ—ๅธˆ', 'ๅคงไพ ', 'ๅฐ‘ไพ ', 'ๅฅณไพ '
]
}
# Common Chinese terms found in web novels (Wuxia/Xianxia/Xuanhuan)
CHINESE_NOVEL_TERMS = {
'cultivation': [
'ๆฐ”', 'ไธน็”ฐ', '็ป่„‰', '็œŸๆฐ”', 'ๅ…ƒๆฐ”', '็ตๆฐ”', 'ไป™ๆฐ”', '็Ž„ๆฐ”', 'ๆ–—ๆฐ”', '้ญ”ๆฐ”', '้ฌผๆฐ”', 'ๅฆ–ๆฐ”', '็…žๆฐ”', '็ฝกๆฐ”', 'ๅ‰‘ๆฐ”', 'ๅˆ€ๆฐ”',
'้‡‘ไธน', 'ๅ…ƒๅฉด', '็ญ‘ๅŸบ', '็ปƒๆฐ”', 'ๅฟƒ้ญ”', '่ฏ†ๆตท', '็ฅž่ฏ†', 'ๅ…ƒ็ฅž', '็ต้ญ‚', '่‚‰่บซ', 'ๆณ•่บซ',
'้“', '้˜ด้˜ณ', 'ไบ”่กŒ', 'ๆญฆ', 'ๅŠŸ', 'ๆณ•', 'ๆœฏ', '็ฅž้€š', '้“ๆณ•', 'ไป™ๆœฏ', '็ฆๅˆถ', '้˜ตๆณ•', '็ฌฆ็ฎ“',
'ๅŠซ', 'ๅคฉๅŠซ', '้›ทๅŠซ', 'ๅฟƒ้ญ”ๅŠซ', '้ฃžๅ‡', 'ๆธกๅŠซ', '้กฟๆ‚Ÿ', '้—ญๅ…ณ', 'ๅ‡บๅ…ณ', 'ๅคบ่ˆ', '่ฝฌไธ–', '่ฝฎๅ›ž',
'็‚ผไธน', '็‚ผๅ™จ', '็‚ผ้˜ต', '็‚ผ็ฌฆ', 'ๅŒไฟฎ', '็‚‰้ผŽ', '้‡‡่กฅ', '่พŸ่ฐท'
],
'beings': [
'ไป™', '้ญ”', 'ๅฆ–', '้ฌผ', '็ฅž', 'ไบบ', '้พ™', 'ๅ‡ค', '้บ’้บŸ', '็Ž„ๆญฆ', '็™ฝ่™Ž', 'ๆœฑ้›€',
'ๅฐŠ่€…', 'ๅœฃไบบ', 'ๅคงๅธ', 'ๅคฉๅฐŠ', '้“็ฅ–', '็œŸไบบ', 'ไธŠไป™', 'ๆ•ฃไป™', 'ๅœฐไป™', 'ๅคฉไป™', '้‡‘ไป™',
'ๆ•ฃไฟฎ', '้‚ชไฟฎ', '้ญ”ไฟฎ', '้ฌผไฟฎ', 'ๅฆ–ไฟฎ', 'ๅ‰‘ไฟฎ', 'ไฝ“ไฟฎ', 'ๆณ•ไฟฎ', 'ๅ™จ็ต', 'ๅ‚€ๅ„ก'
],
'world': [
'ๆฑŸๆน–', 'ๆญฆๆž—', 'ๅคฉไธ‹', 'ๅฎ—้—จ', 'ๅธฎ', 'ๆดพ', 'ๅฎถ', 'ไธ–ๅฎถ', '็š‡ๆœ', 'ๅธๅ›ฝ', 'ๅœฃๅœฐ',
'ไป™็•Œ', '็ฅž็•Œ', '้ญ”็•Œ', 'ๅฆ–็•Œ', '้ฌผ็•Œ', 'ๅ‡ก้—ด', 'ไฟ—ไธ–', 'ไฟฎ็œŸ็•Œ',
'็ง˜ๅขƒ', '้—่ฟน', 'ๆดžๅบœ', '็ฆๅœฐ', 'ๆดžๅคฉ', '็ฆๅœฐ', '็ปๅœฐ', 'ๅŠๅธ‚', 'ๆ‹ๅ–ไผš'
],
'address_self': [
'ๆœฌๅบง', 'ๆœฌๅฎซ', 'ๆœฌ็Ž‹', 'ๆœฌๅฐ‘', 'ๆœฌ็š‡', 'ๆœฌๅธ', 'ๆœฌๅฐŠ', 'ๆœฌๅœฃ',
'ๆœ•', 'ๅญค', 'ๅฏกไบบ', '่€ๅญ', '่€ๅคซ', '่€่บซ', '่€ๆœฝ', '่€่กฒ',
'ๅœจไธ‹', '้„™ไบบ', 'ๅฐ้“', '่ดซ้“', '่ดซๅƒง', 'ๅฐๅƒง', 'ไธๆ‰',
'ๅฅดๆ‰', '่‡ฃ', 'ๅฆพ', 'ๅฆพ่บซ', 'ๆ™š่พˆ', 'ๅฐๅผŸ', 'ๅฐๅฆน', 'ๅญฆ็”Ÿ', 'ๅผŸๅญ', 'ๅพ’ๅ„ฟ'
],
'address_others': [
'้™›ไธ‹', 'ๆฎฟไธ‹', 'ๅจ˜ๅจ˜', '็Ž‹็ˆท', 'ไพฏ็ˆท',
'่€ๅคง', '่€ๆฟ', 'ๆŽŒๆŸœ', 'ๅฐไบŒ',
'้“ๅ‹', 'ๆ–ฝไธป', 'ๅคงๅธˆ', 'ๅธˆๅคช', '็œŸไบบ', 'ไป™ๅญ', 'ไป™้•ฟ',
'ๅ‰่พˆ', 'ๅŽ่พˆ', 'ๅฐๅ‹',
'ๅธˆๅฐŠ', 'ๅธˆ็ˆถ', 'ๅธˆๅ‚…', 'ๅธˆๅ…„', 'ๅธˆๅผŸ', 'ๅธˆๅง', 'ๅธˆๅฆน', 'ๅธˆๅ”', 'ๅธˆไผฏ', 'ๅธˆ็ฅ–',
'ๅ…„ๅฐ', 'ไปๅ…„', '่ดคๅผŸ',
'ๅ…ฌๅญ', 'ๅฐ‘็ˆท', 'ๅฐๅง', 'ๅง‘ๅจ˜', 'ๅคซไบบ', '่€็ˆท', 'ๅคชๅคช'
],
'measurements': [
'้‡Œ', 'ไธˆ', 'ๅฐบ', 'ๅฏธ',
'ๆ–ค', 'ไธค',
'ๆ—ถ่พฐ', 'ๅˆป', 'ๅˆ†', 'ๆฏ', '็‚ท้ฆ™', '็›่Œถ',
'ๅ…ƒ', 'ๆ–‡', 'ไธค', '่ดฏ'
],
'items': [
'ๆณ•ๅฎ', '็ตๅฎ', 'ไป™ๅฎ', 'ๅคๅฎ', '็ตๅ™จ', 'ๆณ•ๅ™จ', 'ไป™ๅ™จ', '็ฅžๅ™จ',
'ไธน่ฏ', '็ตไธน', 'ไป™ไธน', 'ๆฏ’ไธน', 'ๅบŸไธน',
'็ต็Ÿณ', 'ไป™็Ÿณ', '็ตๆ™ถ', '็Ž„็Ÿณ',
'็บณๆˆ’', 'ๅ‚จ็‰ฉ่ข‹', 'ๅ‚จ็‰ฉๆˆ’ๆŒ‡', 'ไนพๅค่ข‹',
'็މ็ฎ€', 'ๅŠŸๆณ•', '็ง˜็ฑ', 'ๅ›พ่ฐฑ',
'็ต่‰', '็ต่ฏ', 'ไป™่‰', 'ๅคฉๆๅœฐๅฎ'
]
}
# Chinese relationship and family terms (important for character relationships)
CHINESE_RELATIONSHIP_TERMS = {
'family': [
'็ˆถไบฒ', 'ๆฏไบฒ', '็ˆท็ˆท', 'ๅฅถๅฅถ', 'ๅค–ๅ…ฌ', 'ๅค–ๅฉ†', 'ไผฏ็ˆถ', 'ไผฏๆฏ',
'ๅ”็ˆถ', 'ๅ”ๆฏ', 'ๅง‘็ˆถ', 'ๅง‘ๆฏ', 'ๅงจ็ˆถ', 'ๅงจๆฏ', '่ˆ…็ˆถ', '่ˆ…ๆฏ',
'ๅ“ฅๅ“ฅ', 'ๅงๅง', 'ๅผŸๅผŸ', 'ๅฆนๅฆน', 'ๅ…„้•ฟ', 'ๅ…„ๅผŸ', 'ๅงๅฆน',
'ๅ„ฟๅญ', 'ๅฅณๅ„ฟ', 'ๅญ™ๅญ', 'ๅญ™ๅฅณ', 'ๅค–ๅญ™', 'ๅค–ๅญ™ๅฅณ',
'ๅคซๅ›', 'ๅคซไบบ', 'ๅฆปๅญ', 'ๅคซๅฆป', 'ๅจ˜ๅญ', 'ๅจ˜ไบฒ', '็›ธๅ…ฌ'
],
'master_disciple': [
'ๅธˆ็ˆถ', 'ๅธˆๅฐŠ', 'ๅธˆๅ‚…', 'ๅธˆๅจ˜', 'ๅธˆ็ฅ–', 'ๅธˆ็ˆถ็ฅ–', 'ๅคชๅธˆ็ˆถ',
'ๅพ’ๅผŸ', 'ๅพ’ๅ„ฟ', 'ๅธˆๅ…„', 'ๅธˆๅง', 'ๅธˆๅผŸ', 'ๅธˆๅฆน', 'ๅธˆๅ”', 'ๅธˆไผฏ',
'ๅธˆๅ…„ๅผŸ', 'ๅธˆๅงๅฆน', 'ๅŒ้—จ', 'ๅธˆ้—จ', 'ไบฒไผ ๅผŸๅญ', 'ๅ†…้—จๅผŸๅญ', 'ๅค–้—จๅผŸๅญ'
],
'sworn': [
'ไน‰็ˆถ', 'ไน‰ๆฏ', 'ไน‰ๅ…„', 'ไน‰ๅผŸ', 'ไน‰ๅ…„ๅผŸ', 'ไน‰ๅญ',
'็ป“ไน‰', 'ไน‰็ป“้‡‘ๅ…ฐ', 'ๆฎƒ่ก€ไธบ็›Ÿ', 'ๆ‹œๆŠŠๅ…„ๅผŸ'
],
'romantic': [
'้“ไพฃ', 'ไผดไพฃ', '็Ÿฅๅทฑ', '็บข้ขœ', '็Ÿฅๅทฑ', 'ไฝณไบบ', '็ˆฑไบบ',
'ๆœชๅฉšๅฆป', 'ๆœชๅฉšๅคซ', 'ๅจ˜ๅญ', 'ๅฆ‚ๆ„้ƒŽๅ›'
]
}
# Chinese mythological and historical elements
CHINESE_MYTHOLOGICAL_TERMS = {
'creatures': [
'้พ™', 'ๅ‡คๅ‡ฐ', '้บ’้บŸ', '็Ž„ๆญฆ', '็™ฝ่™Ž', 'ๆœฑ้›€', '้’้พ™',
'ๅคฉ้ฉฌ', '้พ™้ฉฌ', '็ฅž้นฐ', 'ๅ‡คๅ‡ฐ', '็ซๅ‡ค', 'ๅ†ฐๅ‡ค',
'่™Ž', '็‹ผ', '่ฑน', '็†Š', '้นฐ', '่›‡', '่›Ÿ', '่›Ÿ้พ™',
'้พ™้พŸ', '็ฅžๅ…ฝ', 'ๅœฃๅ…ฝ', 'ๅฆ–ๅ…ฝ', '้ญ”ๅ…ฝ', 'ๅ‡ถๅ…ฝ', '่’ๅ…ฝ'
],
'divine_artifacts': [
'ไธŠๅค็ฅžๅ™จ', 'ๅ…ˆๅคฉ็ตๅฎ', 'ๅ…ˆๅคฉ่‡ณๅฎ', 'ๆททๆฒŒ่‡ณๅฎ',
'ๅผ€ๅคฉ็ฅžๆ–ง', '็›˜ๅคๅนก', 'ๅคชๆžๅ›พ', 'ๆททๆฒŒ้’Ÿ', '้€ ๅŒ–้ผŽ',
'ไน้ผŽ', 'ๅๅคง็ฅžๅ™จ', 'ไธŠๅคๅๅคงๅ‡ถๅ‰‘'
],
'heavenly': [
'ๅคฉๅบญ', 'ๅคฉๅฎซ', 'ๅคฉ็•Œ', 'ไบบ้—ด', 'ๅœฐ็•Œ', 'ๅ†ฅ็•Œ', 'ไฟฎ็ฝ—็•Œ', '้˜ฟไฟฎ็ฝ—็•Œ',
'ไน้‡ๅคฉ', 'ไธ‰ๅไธ‰ๅคฉ', 'ไธ‰ๅไธ‰้‡ๅคฉ', 'ไนๅนฝ', '้ป„ๆณ‰',
'ไธ‰็•Œ', 'ๅ…ญ้“', 'ๅ…ญ้“่ฝฎๅ›ž', 'ๅ…ซ่’', 'ๅ››ๆตท'
],
'legendary': [
'ไธ‰็š‡', 'ไบ”ๅธ', '็›˜ๅค', 'ๅฅณๅจฒ', 'ไผ็พฉ', '็ฅžๅ†œ', '็ƒŽๅธ', '้ป„ๅธ',
'ไป™ไบบ', '็œŸไปญ', 'ๅคง่ƒฝ', 'ๅคงๅธ', 'ๅคฉๅฐŠ', 'ๅœฃไบบ', '่‡ณๅฐŠ', '้“็ฅ–'
]
}
# Chinese elemental and natural forces
CHINESE_ELEMENTAL_TERMS = {
'five_elements': [
'้‡‘', 'ๆœจ', 'ๆฐด', '็ซ', 'ๅœŸ', '้‡‘ๅฑžๆ€ง', 'ๆœจๅฑžๆ€ง', 'ๆฐดๅฑžๆ€ง', '็ซๅฑžๆ€ง', 'ๅœŸๅฑžๆ€ง',
'้‡‘็ตๆ น', 'ๆœจ็ตๆ น', 'ๆฐด็ตๆ น', '็ซ็ตๆ น', 'ๅœŸ็ตๆ น',
'ไบ”่กŒ', 'ไบ”่กŒไน‹ๅŠ›', 'ไบ”่กŒ็›ธ็”Ÿ', 'ไบ”่กŒ็›ธๅ…‹'
],
'yin_yang': [
'้˜ด', '้˜ณ', '้˜ด้˜ณ', '้˜ด้˜ณไน‹ๅŠ›', '้˜ด้˜ณไบŒๆฐ”', '้˜ด้˜ณ่ฐƒๅ’Œ',
'่‡ณ้˜ด', '่‡ณ้˜ณ', '็บฏ้˜ด', '็บฏ้˜ณ', 'ๅคช้˜ด', 'ๅคช้˜ณ',
'้˜ดๆฐ”', '้˜ณๆฐ”', '้˜ดๅฏ’', '้˜ณ็‚Ž'
],
'natural_forces': [
'้ฃŽ', '้›ท', 'ๅ†ฐ', '็”ต', 'ๅ…‰', 'ๆš—', '็ฉบ้—ด', 'ๆ—ถ้—ด',
'้ฃŽๅฑžๆ€ง', '้›ทๅฑžๆ€ง', 'ๅ†ฐๅฑžๆ€ง', '็”ตๅฑžๆ€ง',
'็‹‚้ฃŽ', '้›ท้œ†', 'ๅ†ฐ้œ†', '็ซ็„ฐ', 'ๆฐดๆต', 'ๅœฐ้œ‡',
'ๅคฉๅœฐ็Ž„้ป„', 'ๆททๆฒŒไน‹ๅŠ›', '้ธฟ่’™ไน‹ๆฐ”', 'ๅ…ˆๅคฉไน‹ๆฐ”'
]
}
# Chinese body cultivation and physique types
CHINESE_PHYSIQUE_TERMS = {
'special_physiques': [
'ๅ…ˆๅคฉ้“ไฝ“', 'ๅ…ˆๅคฉ้œธไฝ“', 'ๅ…ˆๅคฉๅœฃไฝ“', 'ๆททๆฒŒไฝ“',
'ไน้˜ดไฝ“', 'ไน้˜ณไฝ“', '้˜ด้˜ณไฝ“', 'ไบ”่กŒไฝ“',
'ๅ‰‘ไฝ“', 'ๅ‰‘้ชจ', 'ๅˆ€้ชจ', 'ๅ‰‘ๅฟƒ', 'ๅˆ€ๅฟƒ',
'้œธไฝ“', 'ๅœฃไฝ“', '้ญ”ไฝ“', 'ไป™ไฝ“', '็ฅžไฝ“',
'ๆ— ๅžข้“ไฝ“', 'ๆ— ๆผ้‡‘่บซ', '้‡‘ๅˆšไธๅ', 'ไธๆญปไน‹่บซ'
],
'spiritual_roots': [
'็ตๆ น', 'ๅคฉ็ตๆ น', 'ๅœฐ็ตๆ น', 'ๅคฉ่ต„', 'ๆ น้ชจ',
'ๅ•็ตๆ น', 'ๅŒ็ตๆ น', 'ไธ‰็ตๆ น', 'ๅ››็ตๆ น', 'ไบ”็ตๆ น',
'ๅผ‚็ตๆ น', 'ๅ˜ๅผ‚็ตๆ น', '็ปไธ–็ตๆ น',
'ๅบŸ็ตๆ น', 'ไผช็ตๆ น', 'ๅŒไฟฎ', 'ๅ…จ็ตๆ น'
]
}
# Chinese treasure and artifact grades
CHINESE_TREASURE_GRADES = {
'grades': [
'ๅ‡กๅ™จ', 'ๅ‡กๅ“', 'ๆ™ฎ้€š', 'ไฝŽ้˜ถ', 'ไธญ้˜ถ', '้ซ˜้˜ถ',
'็ตๅ™จ', 'ๅฎๅ™จ', 'ๆณ•ๅ™จ', '้“ๅ™จ', 'ไป™ๅ™จ', '็ฅžๅ™จ', 'ๅœฃๅ™จ',
'ไธ‹ๅ“', 'ไธญๅ“', 'ไธŠๅ“', 'ๆžๅ“', '็ปๅ“',
'ๅคฉ้˜ถ', 'ๅœฐ้˜ถ', '็Ž„้˜ถ', '้ป„้˜ถ',
'ไธ€ๅ“', 'ไบŒๅ“', 'ไธ‰ๅ“', 'ๅ››ๅ“', 'ไบ”ๅ“', 'ๅ…ญๅ“', 'ไธƒๅ“', 'ๅ…ซๅ“', 'ไนๅ“'
],
'pill_grades': [
'ไธ€็บน', 'ไบŒ็บน', 'ไธ‰็บน', 'ๅ››็บน', 'ไบ”็บน', 'ๅ…ญ็บน', 'ไธƒ็บน', 'ๅ…ซ็บน', 'ไน็บน',
'ไธ€่ฝฌ', 'ไบŒ่ฝฌ', 'ไธ‰่ฝฌ', 'ๅ››่ฝฌ', 'ไบ”่ฝฌ', 'ๅ…ญ่ฝฌ', 'ไธƒ่ฝฌ', 'ๅ…ซ่ฝฌ', 'ไน่ฝฌ',
'ไธนไบ‘', 'ไธน็บน', 'ไธน้›ท', 'ไธน้ฆ™'
]
}
# Chinese naming conventions and patterns
CHINESE_NAME_PATTERNS = {
'courtesy_names': [
# Pattern: Character + ๅญ— (courtesy name marker)
r'[\u4e00-\u9fff]{1,2}ๅญ—[\u4e00-\u9fff]{1,2}', # Xๅญ—Y format
],
'generation_names': [
# Common generation name characters (used in family naming)
'ๆ–‡', 'ๆญฆ', 'ๆ˜Ž', 'ๅพท', 'ไป', 'ไน‰', '็คผ', 'ๆ™บ', 'ไฟก',
'ๅฎ', '็', '็މ', '้‡‘', '้“ถ', 'ๅฏŒ', '่ดต', 'ๅบท', 'ๅฎ',
'ๅ…‰', '่€€', 'ๅŽ', '่ฃ', 'ๆ˜Œ', '็››', 'ๅ…ด', '้š†'
],
'title_prefixes': [
# Common prefixes for titles and names in novels
'่€', 'ๅฐ', 'ๅคง', 'ๅฐ‘', '่ฏธ', # Old, Young, Great, Young Master, All
'ๆ— ', '็Ž„', '็ซ', 'ๅ†ฐ', '้›ท', '้ฃŽ', 'ๅคฉ', '้ญ”', 'ๅ‰‘', 'ๅˆ€', # Elemental prefixes
'้พ™', 'ๅ‡ค', '่™Ž', '้นฐ', '็‹ผ', '่ฑน', # Animal prefixes
'ๅœฃ', '้ญ”', 'ไป™', '็ฅž', '้ฌผ', 'ๅฆ–' # Divine/demonic prefixes
],
'clan_prefixes': [
# Common clan/family name structures
'ๅฎถๆ—', 'ไธ–ๅฎถ', 'ๆฐๆ—', 'ๅฎ—ๆ—', 'ไธ€ๆ—',
'็š‡ๆ—', '็ฅžๆ—', '้ญ”ๆ—', 'ๅฆ–ๆ—', 'ๅคๆ—'
]
}
# Additional cultivation power systems (system novels, game novels)
CHINESE_POWER_SYSTEMS = {
'levels': [
'ไธ€็บง', 'ไบŒ็บง', 'ไธ‰็บง', 'ๅ››็บง', 'ไบ”็บง', 'ๅ…ญ็บง', 'ไธƒ็บง', 'ๅ…ซ็บง', 'ไน็บง', 'ๅ็บง',
'ๅˆ็บง', 'ไธญ็บง', '้ซ˜็บง', '้กถ็บง', 'ๅทฅ็บง',
'ไธ€้˜ถ', 'ไบŒ้˜ถ', 'ไธ‰้˜ถ', 'ๅ››้˜ถ', 'ไบ”้˜ถ', 'ๅ…ญ้˜ถ', 'ไธƒ้˜ถ', 'ๅ…ซ้˜ถ', 'ไน้˜ถ',
'้’้“œ', '็™ฝ้“ถ', '้ป„้‡‘', '้“‚้‡‘', '้’ป็Ÿณ', '็Ž‹่€…', '็š‡่€…'
],
'stars_moons': [
'ไธ€ๆ˜Ÿ', 'ไบŒๆ˜Ÿ', 'ไธ‰ๆ˜Ÿ', 'ๅ››ๆ˜Ÿ', 'ไบ”ๆ˜Ÿ', 'ๅ…ญๆ˜Ÿ', 'ไธƒๆ˜Ÿ', 'ๅ…ซๆ˜Ÿ', 'ไนๆ˜Ÿ',
'ไธ€ๆœˆ', 'ไบŒๆœˆ', 'ไธ‰ๆœˆ', 'ๅ››ๆœˆ', 'ไบ”ๆœˆ', 'ๅ…ญๆœˆ', 'ไธƒๆœˆ', 'ๅ…ซๆœˆ', 'ไนๆœˆ',
'ไธ€่ฝฎ', 'ไบŒ่ฝฎ', 'ไธ‰่ฝฎ', 'ๅ››่ฝฎ', 'ไบ”่ฝฎ', 'ๅ…ญ่ฝฎ', 'ไธƒ่ฝฎ', 'ๅ…ซ่ฝฎ', 'ไน่ฝฎ',
'ๅŠๆœˆ', 'ๆปกๆœˆ', 'ๆ–ฐๆœˆ'
],
'circles_rings': [
'ไธ€็Žฏ', 'ไบŒ็Žฏ', 'ไธ‰็Žฏ', 'ๅ››็Žฏ', 'ไบ”็Žฏ', 'ๅ…ญ็Žฏ', 'ไธƒ็Žฏ', 'ๅ…ซ็Žฏ', 'ไน็Žฏ',
'ไธ€ๅœˆ', 'ไบŒๅœˆ', 'ไธ‰ๅœˆ', 'ๅ››ๅœˆ', 'ไบ”ๅœˆ', 'ๅ…ญๅœˆ', 'ไธƒๅœˆ', 'ๅ…ซๅœˆ', 'ไนๅœˆ',
'้ญ‚็Žฏ', '้ญ‚ๅœˆ', '็ต็Žฏ', '็ตๅœˆ'
],
'colors': [
'็™ฝ่‰ฒ', '้ป„่‰ฒ', '็ดซ่‰ฒ', '้ป‘่‰ฒ', '็บข่‰ฒ', '่“่‰ฒ', '็ปฟ่‰ฒ', '้‡‘่‰ฒ', '้“ถ่‰ฒ',
'็™ฝ็บง', '้ป„็บง', '็ดซ็บง', '้ป‘็บง', '็บข็บง', '่“็บง', '็ปฟ็บง', '้‡‘็บง', '้“ถ็บง'
]
}
# Chinese location types (common in novels)
CHINESE_LOCATION_TYPES = {
'buildings': [
'ๅฎซ', 'ๆฎฟ', '้˜', 'ๅ ‚', '้ฆ†', '้™ข', 'ๆฅผ', '่ฝฉ', 'ไบญ', 'ๅฐ',
'ๅคงๆฎฟ', 'ไธปๆฎฟ', 'ๅทฆๆฎฟ', 'ๅณๆฎฟ', 'ๅทๆฎฟ', 'ๅŽๆฎฟ',
'่—็ป้˜', 'ไผ ๅŠŸ้˜', '็‚ผๅ™จ้˜', '็‚ผไธน้˜', 'ไปปๅŠกๅคงๅŽ…'
],
'natural': [
'ๅฑฑ', 'ๅณฐ', 'ๅฒญ', 'ๆฐด', 'ๆฒณ', 'ๆน–', 'ๆตท', 'ๆฑŸ', '่ฐท', 'ๆž—', 'ๆดž',
'ไธปๅณฐ', 'ๅŒ—ๅณฐ', 'ๅ—ๅณฐ', 'ไธœๅณฐ', '่ฅฟๅณฐ',
'ๅคงๅฑฑ', '็ฅžๅฑฑ', '้ญ”ๅฑฑ', 'ไป™ๅฑฑ', '็ตๅฑฑ',
'ๆ˜Ÿๆตท', 'ๆ˜Ÿ็ฉบ', 'ๆ˜ŸๅŸŸ', 'ๆ˜Ÿ็ƒ', 'ๆ˜Ÿ่พฐ'
],
'regions': [
'ๅŸŸ', 'ๅขƒ', '็•Œ', 'ๅœฐ', 'ๅทž', '้ƒก', 'ๅŸŽ', '้•‡', 'ๆ‘', 'ๅŠ',
'ไธœๅŸŸ', '่ฅฟๅŸŸ', 'ๅ—ๅŸŸ', 'ๅŒ—ๅŸŸ', 'ไธญๅŸŸ',
'ไธŠ็•Œ', 'ไธญ็•Œ', 'ไธ‹็•Œ', 'ไธ‹ไฝ็•Œ', 'ไธญไฝ็•Œ', 'ไธŠไฝ็•Œ',
'ไฟฎ็œŸ็•Œ', 'ไป™็•Œ', '็ฅž็•Œ', '้ญ”็•Œ', 'ไฝ›็•Œ', 'ๅฆ–็•Œ'
]
}
# Chinese battle and technique descriptors
CHINESE_BATTLE_TERMS = {
'attack_types': [
'ๆ”ปๅ‡ป', '้˜ฒๅพก', '่บซๆณ•', 'ๆญฅๆณ•', '้€Ÿๅบฆ', 'ๅŠ›้‡',
'ๅ‰‘ๆฐ”', 'ๅˆ€ๆฐ”', 'ๆ‹ณๅŠฒ', 'ๆŽŒๅŠ›', 'ๆŒ‡ๅŠ›', '่…ฟๅŠ›',
'็œŸๅ…ƒ', '้ญ‚ๅŠ›', '็ฒพ็ฅžๅŠ›', '็ฅž่ฏ†', '็ฅžๅฟต'
],
'techniques_suffixes': [
'่ฏ€', 'ๆณ•', 'ๆœฏ', 'ๅŠŸ', 'ๅฟƒๆณ•', '็ง˜ๆณ•', '็ฅž้€š',
'ไธ€ๅผ', 'ไธ€ๆ‹›', 'ไธ€ๅ‡ป', 'ไธ€ๆŒ‡', 'ไธ€ๆŽŒ', 'ไธ€ๅ‰‘', 'ไธ€ๅˆ€'
],
'power_descriptors': [
'ๆ— ๆ•Œ', 'ๆ— ๅŒ', 'ๆ— ไธŠ', '่‡ณๅผบ', '่‡ณๅฐŠ', 'ๆž่‡ด', '็ปไธ–',
'้œธ้“', '็Ž‹้“', 'ๅœฃ้“', 'ไป™้“', '็ฅž้“', '้ญ”้“'
]
}
CHINESE_NUMS = {
# Basic numbers
'ไธ€': 1, 'ไบŒ': 2, 'ไธ‰': 3, 'ๅ››': 4, 'ไบ”': 5,
'ๅ…ญ': 6, 'ไธƒ': 7, 'ๅ…ซ': 8, 'ไน': 9, 'ๅ': 10,
'ๅไธ€': 11, 'ๅไบŒ': 12, 'ๅไธ‰': 13, 'ๅๅ››': 14, 'ๅไบ”': 15,
'ๅๅ…ญ': 16, 'ๅไธƒ': 17, 'ๅๅ…ซ': 18, 'ๅไน': 19, 'ไบŒๅ': 20,
'ไบŒๅไธ€': 21, 'ไบŒๅไบŒ': 22, 'ไบŒๅไธ‰': 23, 'ไบŒๅๅ››': 24, 'ไบŒๅไบ”': 25,
'ไธ‰ๅ': 30, 'ๅ››ๅ': 40, 'ไบ”ๅ': 50, 'ๅ…ญๅ': 60,
'ไธƒๅ': 70, 'ๅ…ซๅ': 80, 'ไนๅ': 90, '็™พ': 100,
# Classical/formal numbers
'ๅฃน': 1, '่ดฐ': 2, 'ๅ': 3, '่‚†': 4, 'ไผ': 5,
'้™†': 6, 'ๆŸ’': 7, 'ๆŒ': 8, '็Ž–': 9, 'ๆ‹พ': 10,
'ไฝฐ': 100, 'ไปŸ': 1000, '่ฌ': 10000, 'ไธ‡': 10000,
# Ordinal indicators
'็ฌฌไธ€': 1, '็ฌฌไบŒ': 2, '็ฌฌไธ‰': 3, '็ฌฌๅ››': 4, '็ฌฌไบ”': 5,
'้ฆ–': 1, 'ๆฌก': 2, 'ๅˆ': 1, 'ๆœซ': -1,
}
# Gender indicator patterns for pronoun-based gender detection
# Note: These are PRONOUNS, not titles or honorifics
GENDER_PRONOUNS = {
'korean': {
'male': ['๊ทธ๋Š”', '๊ทธ๊ฐ€', '๊ทธ๋ฅผ', '๊ทธ์˜', '๊ทธ์—๊ฒŒ', '๊ทธ๋„', '๊ทธ๋งŒ', '๊ทธ์กฐ์ฐจ', '๊ทธํ•œํ…Œ'],
'female': ['๊ทธ๋…€๋Š”', '๊ทธ๋…€๊ฐ€', '๊ทธ๋…€๋ฅผ', '๊ทธ๋…€์˜', '๊ทธ๋…€์—๊ฒŒ', '๊ทธ๋…€๋„', '๊ทธ๋…€๋งŒ', '๊ทธ๋…€์กฐ์ฐจ', '๊ทธ๋…€ํ•œํ…Œ'],
},
'japanese': {
'male': ['ๅฝผใฏ', 'ๅฝผใŒ', 'ๅฝผใ‚’', 'ๅฝผใฎ', 'ๅฝผใซ', 'ๅฝผใ‚‚', 'ๅฝผใ ใ‘', 'ๅฝผใ“ใ'],
'female': ['ๅฝผๅฅณใฏ', 'ๅฝผๅฅณใŒ', 'ๅฝผๅฅณใ‚’', 'ๅฝผๅฅณใฎ', 'ๅฝผๅฅณใซ', 'ๅฝผๅฅณใ‚‚', 'ๅฝผๅฅณใ ใ‘', 'ๅฝผๅฅณใ“ใ'],
},
'chinese': {
'male': ['ไป–', 'ไป–็š„', 'ไป–ไปฌ', 'ไป–่ฏด', 'ไป–ๆ˜ฏ', 'ไป–ๅœจ', 'ไป–ไผš', 'ไป–ๆƒณ'],
'female': ['ๅฅน', 'ๅฅน็š„', 'ๅฅนไปฌ', 'ๅฅน่ฏด', 'ๅฅนๆ˜ฏ', 'ๅฅนๅœจ', 'ๅฅนไผš', 'ๅฅนๆƒณ'],
},
'english': {
'male': [' he ', ' his ', ' him ', ' himself ', 'He ', 'His ', 'Him '],
'female': [' she ', ' her ', ' hers ', ' herself ', 'She ', 'Her ', 'Hers '],
}
}
# Common words - keeping the same for filtering
COMMON_WORDS = {
'๋งˆ์Œ', '์‹œ์ฒญ์ž', '๋ฌผ๋ก ', 'ํ‰๊ท ', 'ํ‡ด๊ทผ', 'ํšŒ์žฅ', '์ž‘๊ฐ€', '์ง„์งœ', '์ด๋ฏธ',
'๋ณด๋‚ด๊ธฐ', '์ž ', '๊ทธ๋Ÿฐ๋ฐ', '์†Œ๋ฌธ', '์–ธ์ œ๋‚˜', '๊ฑฐ๋Œ€ํ•œ', '์„ฑ๊ณต', '๋ฐฉ์†ก', '๊ทธ๋‚ ',
'์ด๋ ‡๊ฒŒ', '์ƒํŒ', '์œ ๋™', 'ํŒŒ์ด', '์ดํ•ด', '๊ทธ๊ฒŒ', '๋ฉด์ ‘', '์ฒ˜์Œ', '๋ˆ„๊ตฌ', 'ํ™•๊ณ ',
'ํŒ๋งค', '์†Œ๋น„', '๋งŒ์กฑ', '๊ณ ์ •', '๊ณ ๋“ฑํ•™', '๊ธˆ๊ธฐ', '์šฐ์„ ', '๋…ธ๋ž˜', '์ฐธ๊ฐ€', 'ํŽธ์ง‘',
'์‹ค๋ช…', '๊ด€๋ฆฌ', '์ƒ๋ฐฉ์†ก', '์ค‘๋…', '์ฒซ๋‚ ', '๋ฐฉ์žฅ', '์ƒ๋‚จ', '์‹คํ–‰', '์ตœ๊ทผ', '์‹ค๋ ฅ',
'๊ธฐ์กด', 'ํ† ํฌ', 'ํšจ๊ณผ', '์• ๊ต', '์ถฉ์กฑ', '์ตœ๊ณ ', '๊ทผ๋ฌด', '์žฅ๋น„', '๋ฐœ์ „', '์ด๋ฏธ์ง€',
'๋งค๋ ฅ', '๋ถ€๊ฐ', '์ด์šฉ', '๋ณธ์ธ', '์„ค๋ช…', '์ด์ ', '๊ฒฝ์Ÿ', '์ดˆ๋ฐ˜', '์„ ๊ตฌ', '๋Œ€๊ธฐ์—…',
'์ „ํ™˜', '์ปจํ…์ธ ', '๋‹น์—ฐ', '์–ผ๊ตด', '๊ธฐํšŒ', '๋‚˜์ด', '์ด์ œ', 'ํ›„์—', '์„ค๋งˆ', '์ƒํ™ฉ',
'์‚ฌ์ง„', '์ค‘๋ฐ˜', '๋น„์Šท', '๋ฌธ์ œ', '์ตœ์ดˆ', '์ธ๋ฐฉ', '์ •๋ฆฌ', 'ํ•ฉ๋ฐฉ', 'ํ™ฉ๊ธˆ', '์ •๋„',
'์‹œ์ž‘', '๋…ผ๋ž€', '์œ ๋ช…', '์ธ์ง€๋„', '์ง€๊ธˆ', '์˜ˆ์ „', '์˜›๋‚ ', 'ํœด๋ฐฉ', '๋ฐ๋ท”', '์ธ์›',
'๊ด€์‹ฌ', 'ํ™”์งˆ', '๋Šฅ๋ ฅ', '์˜ค๋””์…˜', '์„ฑ์žฅ', '์ง€์›', '๋‚™์ˆ˜', '์‹œ์›', '์œ ์น˜์›', '๋งค๋‹ˆ์ €',
'์‚ฌ๋žŒ', '๋ฌด๋ ต', '๋ˆ', '๊ฒฝ๋ ฅ', '๋‚ด์šฉ', '์ˆซ์ž', '๋‹‰๋„ค์ž„', '๊ณต๊ฐ„', '์ง์ ‘', '์ ๋‹น', '์ดˆ์žฅ',
'์—ฐ๋ง', '๊ฐ์ธ', '์นจ๋ฌต', '์†Œ๊ฐœ', '๊ฐ์ •', '์‚ฌํšŒ', '๋‹ค์–‘', '๊ณ ์‚ฌ', '์•…์งˆ', '๋ณต์žฅ', '์•„๋ฌด',
'์ดํ›„', '์˜ค์ „', '์˜ค๋žœ๋งŒ', '์‹ ์ฒญ', '์‹ธ์›€', '์˜ค๋Š˜', 'ํ›„์›', '์ข…๋ฃŒ', '๊ด€๋ จ', '์ฒด๊ธ‰', '์ ์ ˆ',
'์ฃผ์ตœ', '์ž๋ฃŒ', '์—ฌ์œ ', '์‚ฌ์ „', '์›๋ž˜', '๋ช…์‹ค์ƒ', '์žํ™”', 'ํ”ผํ•ด', '์†Œํ†ต', 'ํ•˜๋‚˜', '์ด์ƒ',
'๋ชฐ์ž…', '๊ฐ๋™', 'ํ€„๋ฆฌํ‹ฐ', '๊ธฐ์ˆ ', '๋‹จ์–ด', '์„œ๋น„์Šค', '์ž ์‹œ', 'ํ™˜๊ธฐ', '์„ ๋ฐฐ', '์ž์„ธ', '์ฃผ์œ„',
'์˜คํžˆ๋ ค', '์ด์•ผ๊ธฐ', '๋„์ž…', '์ด์œ ', 'ํ™•์ธ', '์ค‘์š”', '์ตœ์ ', '์ถ”๊ฐ€', '๊ฐค๋Ÿฌ๋ฆฌ', 'ํ…ƒ์„ธ', '๋ถ€๋ถ„',
'๋Œ€์„ฑ', '๊ฐ„๋‹จ', '์ Š์€', '์‘์›', '์†Œ์œ ', 'ํœด์‹', '์ตœ์ข…', 'ํ•ฉ๊ฒฉ', '์ถฉ๋ถ„', '์ง„์ง€', 'ํ•˜์ด๋ผ์ดํŠธ',
'์Šน๋ฆฌ', '์ƒ๊ฐ', '์ˆœ๊ฐ„', '๋ƒ‰์ฒ ', '๊ธฐํšŒ์ฃผ์˜', '๊ณ ์ง‘', '๋ฐ˜์‘', '์•„์ด๋Œ', 'ํ™”๋ ค', '๊ธฐ์–ต', '์ผ์ƒ',
'๋งค์ผ', '๋ชฉ์†Œ๋ฆฌ', '๋ฌด๋Œ€', '์ค‘๊ฐ„', '๋ฐฐ์‹ ', '์˜๊ฒฌ', '์ˆœ์‹๊ฐ„', '๋‚š์‹œ', '๋‹น์žฅ', '์—ฐ์Šต', '๊ณผ๊ฑฐ',
'ํŒฌ๋ค', '์ผ์ •', '๋ถˆ๋งŒ', '์š•๋ง', '์ˆ˜์ต', 'ํ™•์‹ค', '์ทจ๋ฏธ', '์—ฌ๋ก ', '๋Œ€์ƒ', 'ํƒˆ๋ฝ', '์‚ฌ๊ณผ', '๋Œ€ํ•™',
'์ง‘์ค‘', 'ํšŒ์˜', 'ํฌ์‹', '์ œ์™ธ', '์š•์‹ฌ', '๋ณ€์ˆ˜', '๋ณ€ํ™”', '๊ฒฝ์šฐ', '์€๊ทผ', '๋ถ€์กฑ', '์ž…์žฅ', '๋น„๊ต',
'์ฝ˜์„œํŠธ', '๋ถ„์œ„๊ธฐ', '์˜คํ”„๋‹', '๋ชจ์Šต', 'ํ›„๋ณด', '๋ฉ”์ธ', '์ธ์‚ฌ', '์ธํ„ฐ๋ทฐ', '๊ฐ์„ฑ', 'ํ•ด์†Œ', '๊ฐ•ํ–‰',
'๊ฒฐ๊ณผ', '๋…ธ์ถœ', '๋ฐฉ๋ฒ•', '์˜์ƒ', 'ํ•˜์ฐจ', '์—ฐ์žฅ', '์ดํƒˆ', '๊ตฌ๋งค', '์˜์•„', 'ํ•ฉ๋ฅ˜', '์ค€๋น„', '์ผ๊ฐœ',
'๋จธ๋ฆฌ', '์‹œ๊ฐ„', '๋ฏธ์„ฑ๋…„', '๋ฏฟ์Œ', '์ดˆ๋ณด', '์žฅ๊ธฐ', '๊ทœ์น™', '๊ณ„์†', '์ •์‹ ', '๋•๋ถ„', '๊ฐ์ž', 'ํฌ๋ฃจ',
'๋ฉค๋ฒ„', '๋‹จ์ˆœ', '๋ณธ๊ฒฉ', '์ด๋ฆ„', '๋‹น์ฒจ', '๊ฒฐํ˜ผ', '์• ๋งค', '์‚ฌ์†Œ', 'ํŒ€', '๋‹คํˆผ', '๋ฆฌ๋”', '์„œ๋กœ', '์ •๋ณด',
'๊ฐ€์ž…', '๊ฐˆ๋“ฑ', 'ํ”„๋ฆฌ์นด', '์ˆ˜ํ˜œ', '์ˆ˜์ž‘', 'ํƒ๋ฐฉ', '์†Œ์ค‘', '์—ฐ์• ', '์ž๊ฒฉ', '์ž์—ฐ', '๊ฒฝ๊ณ„', 'ํ™œ์•ฝ',
'์ตœ๋Œ€', '๋Œ“๊ธ€', 'ํž˜', '์ฐธ๊ต์œก', '๊ฒŒ์ž„', '๋Œ€๊ฒฐ', '๋ฏธ์…˜', '์ •์ฐฉ', 'ํ™”๋ฉด', 'ํŒฌ์„œ๋น„์Šค', 'ํŒจ๋ฐฐ', 'ํƒ‘',
'์€์ธ', '์ƒ์Šน', '์ดˆ์‹ฌ', '๊ฑฐ๋ž˜', '์–‘ํ•ด', '์ง„์ •', '๋‹น์‹œ', '์„ค๋“', '๋ฉธ๋ง์ „', '์ˆ˜์ •', '์žฌ์ƒ', '์„ธ๋ ฅ',
'๊ต์œก', '์„œ๋ฒ„', 'ํ‡ด์ถœ', '๊ทน๋Œ€ํ™”', 'ํ™”์ œ', 'ํƒˆํ‡ด', '์ˆ™๋ จ', '์œ ํŠœ๋ธŒ', '์š”์ฆ˜', '์ตœ์†Œํ™”', '์กฐ๊ฑด', '๊ฒฝ์•…',
'์ž ', '์กฐ์„ ', '์ˆ˜์ž…', '๋ฐœํ‘œ', '์„ฑ์‚ฌ', '์˜๋ฏธ', '์ž๋ฆฌ', 'ํ˜ธ๊ธฐ์‹ฌ', '์ดˆ๊ธฐ', '๋ทฐ์–ด์‹ญ', '์ž…์ฃผ', '์‹œ์ ˆ', '์ˆ˜์žฅ',
'๋ชจ์ง‘', '๋‚˜๋จธ์ง€', 'ํƒ“', '์„ธ์ƒ', '๊ถŒ๋ ฅ', '์ผ', '์›”๋“œ', '๋Œ€ํ™”', '๋ฏธ๋ž˜', 'ํšŒ๋ณต', '์•ˆ์ •', 'ํ‰์ฒญ', 'ํŒฌ', '์žฌํ™”',
'์‚ฌ์šฉ', '์ ‘์†', '์šด์˜', '์ œ์ž‘', '๊ทœ๋ชจ', '๋ฐ•์ˆ˜', 'ํฅ๋ถ„', '๊ฒฝ๋ก€', '์›ƒ์Œ', 'ํ•ด์„ค', '๋ฐฉ์‹ฌ', '๊ฐœ', '๋ ˆ๋“œ', '์นผ๋‚ ',
'๋ฐดํ”ฝ', '๋…ธ๋ฐฉ์ข…', '์ธํ„ด', 'ํŒŒ๋ฐ', '๋งˆ๋ฒ•', '์ฆ๊ฐ€', '์ฐจ์ด', '์‹œ์ ', '๋…ธ๋ ฅ', '์กฐ๋ ฅ', '๊ทธ๋Œ€', '๋‹ค์ด์•„', '๊ด‘์งˆ', '๋ฐฉํ•ด',
'๋ฉ˜ํƒˆ', '๋‚˜๋ฆ„', '๋ฌด๋ฒ•', '๋ณ„๋ช…', '์•„์ดํ…œ', '์ˆ˜๋ฉด', '๊ณ ๊ฐ', '๋…ธ๋™', '์ธ์‹', '์ฃผ์ž…', '๊ฑด์ถ•', '์ปจํŠธ๋กค', '์™„์„ฑ', 'ํ˜ธ๊ฐฑ',
'๋ฉ‹์ง„', '์žฌ๋ฃŒ', '์ด๋™', '๊ฐ‘์˜ท', '์ถ”์ข…', '์‹ค๋ง', 'ํ›„๋ฐฐ', '๋ง‰๋Œ€', '์˜คํ”ˆ', '๋‚จ์„ฑ', '๊ธฐ์Šต', '๋‚œ๋™', '์ž์œ ', '์›ํ•˜', '์ธ๋งฅ',
'์‚ฌ์‹ค', 'ํฌํ•จ', '์ •ํ™•', '์นœ์ ˆ', '์ž์˜์—…', '์‚ฌ์ฑ„์—…', '์ง€ํ•˜', '๋ฐ˜์ „', '์ธ์—ฐ', '๋ฌด์กฐ๊ฑด', '์—ฌ๋ก ์กฐ์ž‘', '๊ธˆ์ง€', '์ „์ฒด', '์„ ๋ฌผ',
'์ •๊ทœ', 'ํ˜ผ์ž', '๋ณด์œ ', '์ง„ํ–‰', '์ง€์ง€', '์šฐ์Šน', '๋กค', '๋ฐ”๋‹ฅ', '๋ฒ”์ฃ„', '์ •์ƒํ™”', '์ˆœ์ˆœ', '๋งค๋ ฅ', 'ํฌ์ƒ', '์—ฌ๋Ÿฟ', '๊ฒฝ๊ธฐ',
'์—ด๊ด‘', '๋ณธ์ธ', '์ง„์‹ฌ', 'ํ˜„์—ญ', '๊ฐœ์ธ', '์ง์›', '๊ฐํƒ„', 'ํญ์ฃผ', '์‹œ์ƒ์‹', '์ข…์ผ', '์ˆ˜์ƒ', '๋‚ด๋…„', '์˜ฌํ•ด', 'ํ‰๊ฐ€', 'ํƒ„์ƒ',
'์ตœ์—ฐ์žฅ', '์••๋„', 'ํ‡ด์—ญ', '๋ธŒ์ด', '์•ˆ๋‚ด', 'ํญ๋ฐœ', '๊ณต๊ฒฉ', '์ทจ์นจ', '์ž๊ธˆ', '๋…์žฌ', '์‚ฌ์—…', '์นœ๊ตฌ', '์—ญ์‚ฌ', 'ํ™•์‹ค', '์„ฑ๋Œ€',
'์‚ผํ–‰', '์˜ค๋น ', '์†Œ์ง„', '๋ฌด๋ ฅํ™”', '์›๊ฑฐ๋ฆฌ', '๊ณ ์กฐ', '๊ณ„ํš', 'ํ‹ˆ์ƒˆ', '๋œป', '๋™์—…', '์˜ˆ์—ด', '์ฆํญ', 'ํ›„๋ฐ˜', '์กด์žฌ', 'ํŽ€๋”ฉ',
'์ˆ˜๋‡Œ', '์ˆ˜์ค‘๋„', '์ตœ๊ฐ•', '๋‹จ์ฒด', '๋ฐฐํŒ…', '์ตœ์†Œํ•œ', '์ˆœ์„œ', '๊ธฐ๋ณธ', '์žฌ์‚ฐ', 'ํŠน์ •', '๊ฒฝ๋งค', '๊ณ ์ƒ', '๋“ฑ์žฅ', '๊ต‰์žฅ', '์ฑ„ํŒ…',
'๊ธฐ์„ ', 'ํฅํ–‰', 'ํ˜‘๋ ฅ', '์ธ๊ธฐ', '๊ธ‰', '๋‚ฉ๋“', '์ฐจ๋Ÿ‰', '์ง‘ํ•ฉ', '๋ฐ˜๋ฐ•', '๋ฌด๊ธฐ', 'ํ™œ์„ฑํ™”', '์ด๋“', '์ค‘์š”', 'ํฌ์ธํŠธ', '์—…๋กœ๋“œ',
'์ค‘๊ณ„', '๊ธฐ์ž', '์ „ํˆฌ', '์กฐ์šฉ', '์ž์‹ ๊ฐ', '๋Œ€๊ฒฐ', '๊ฒฌ์ œ', '์ ์ค‘', '์ž‘๋™', 'ํ›ˆ๋ จ', '์ ˆ๋Œ€', '๊ฒฝํ—˜', '์ž์›', '๋Œ€๋‹ด', '์ด๋ชจ',
'์ƒํ™œ', '๊ตฌ๊ฒฝ', '๋‹จ์ˆจ', '๋™์ผ', '์ด๋‚ด', 'ํ‹ฐ์–ด', '์˜ํ–ฅ๋ ฅ', '์—ญํ• ', '์ธ์ƒ', '์ž…์žฅ', '๋‹ด๋‹น', '์ต์ˆ™', '๋ฐ๋ท”', 'ํ™œ๋™', '๊ณต๊ฐœ',
'๋‚จ์ž', '๊ฑท๊ธฐ', '์˜ˆ์„ ', '๋งˆ๊ฐ', '์ž๊ธ‰', 'ํŒ€์›', '๋ฒ”์œ„', '๋งค์žฅ', '์•”์‚ด', '๋ถ€๋ถ„', '๋ฏธ๋“œ', 'ํŒŒ์•…', '์ตœ์•…', '๊ฐœ๋ฐœ', '์‹œ์ฆŒ',
'ํŠน๋ณ„', '๋ฐ์ดํŠธ', '๋งˆ์Šคํฌ', '์‹์‚ฌ', '์น˜ํ‚จ', '์—ฌ์œ ', '์‹œ๊ธฐ', '์ž ๊น', '๊ธฐ๋Œ€', '์Šคํ‚ฌ', '๊ด€๊ณ„', '๊ฒฐ์Šน์ „', '์ฆ๊ฑฐ', '๊ณ ๋ชจ', '๊ฐ€๊ฒฉ',
'์ฆ๊ฑฐ', '์ค€๋น„', '๋„‰๋„‰', '๊ณต์šฉ', '๊ฐ•ํ™”', '๋งˆ์Šคํ„ฐ', '์ง์—…', '๋ฐฐ๋‹ฌ', '์ƒ์กด', '์™„๋ฒฝ', '์นญํ˜ธ', '์‚ฌ๋ƒฅํ„ฐ', '์ฆ๊ฒจ์ฐพ๊ธฐ', '์†๋ชฉ',
'์ผ€์ดํฌ', '์ „์ง', '์‚ฌ๋ง', '๋†๋ถ€', '๊ฐ€๋Šฅ', '๊ฐ•์ฒ ', '๋น„์šฉ', '๊ฐ•๋ ฅ', '๊ทธ๋ฆผ', '์ ๊ฒ€', '๋ฐœ๊ฒฌ', '๊ตฌ๊ฐ„', '์•ฝ์†', '์š”๋ฆฌ',
'ํš๋“', '๊ฐ์‹œ', '๋ฒ ์ŠคํŠธ', '๋ ˆ์ด๋“œ', '์–ผ์Œ', '์ตœ๋‹จ', '์ด์•ผ๊ธฐ', 'ํ™”์ œ', '์ฒญ์†Œ', '์›์ž‘', '๋‹จ์ผ', '์†Œ๋…€', '์ฃผ์ฃผ', '๋„์ „',
'์œ ๋ฆฌ', 'ํ•œ๊ตญ', 'ํŒŒํ‹ฐ', '๋Œ€ํšŒ', '์ „๊ตญ', '๊ตญ์ œ', '์Šคํƒฏ', '๊ฐœ์ฒ™', '๋„ˆํ”„', '์ง„ํ™”', '๋†€์ดํ„ฐ', 'ํžˆ๋“ ', '์•ˆ๋…•',
'์ด', '๊ทธ', '์ €', '์šฐ๋ฆฌ', '๋„ˆํฌ', '์ž๊ธฐ', '๋‹น์‹ ', '์—ฌ๊ธฐ', '๊ฑฐ๊ธฐ', '์ €๊ธฐ',
'์˜ค๋Š˜', '๋‚ด์ผ', '์–ด์ œ', '์ง€๊ธˆ', '์•„๊นŒ', '๋‚˜์ค‘', '๋จผ์ €', '๋‹ค์Œ', '๋งˆ์ง€๋ง‰',
'๋ชจ๋“ ', '์–ด๋–ค', '๋ฌด์Šจ', '์ด๋Ÿฐ', '๊ทธ๋Ÿฐ', '์ €๋Ÿฐ', '๊ฐ™์€', '๋‹ค๋ฅธ', '์ƒˆ๋กœ์šด',
'ํ•˜๋‹ค', '์žˆ๋‹ค', '์—†๋‹ค', '๋˜๋‹ค', 'ํ•˜๋Š”', '์žˆ๋Š”', '์—†๋Š”', '๋˜๋Š”',
'๊ฒƒ', '์ˆ˜', '๋•Œ', '๋…„', '์›”', '์ผ', '์‹œ', '๋ถ„', '์ดˆ',
'์€', '๋Š”', '์ด', '๊ฐ€', '์„', '๋ฅผ', '์—', '์˜', '์™€', '๊ณผ', '๋„', '๋งŒ',
'์—์„œ', '์œผ๋กœ', '๋กœ', '๊นŒ์ง€', '๋ถ€ํ„ฐ', '์—๊ฒŒ', 'ํ•œํ…Œ', '๊ป˜', '๊ป˜์„œ',
# Expanded Common Nouns (based on debug findings)
'์–ด๋ฆฐ์ด์‚ฌ', '๋ฐ˜๋“œ', '๋ฒˆ์งธ', '์ˆ˜์‹œ๋กœ', '์‹œ์ฒญ', '๊ทธ๋ ‡๊ณ ', '๊ฑฐ๋ผ', '์–ด๋А๋ง',
'ํ•™์ฐฝ', '์•„๊ธฐ', '์ „ํ˜€', '๋™์•ˆ', '๋‹น์‚ฌ', '๋ถ€๊ธ€', '์ง„์ž‘', '๋ˆ์„', '์•„๋‹ˆ',
'๊ฒƒ๋„', '์ผ์ด', '์Ÿ์•„', '๋ฃจ์‹œ๊ฐ€', '๋ฐฉ์ ‘', '๋‚˜๋„', 'ํ•ด๋ณด', '๊ทธ๋ ‡๊ฒŒ', '๋ญ”๊ฐ€',
'์‚ฌ์ด', 'ํšŒ๊ท€', '๋Œ๊ธฐ', '์Šคํ† ๋ฆฌ๊ฐ€', '์ฃผ์ธ', '๋ผ๊ณ ', '์„ธ๊ธˆ์„', '์บ”๋””๋ฅผ',
'๊ตฌ๋…', '์ฃผ์‹์„', '์–ด๋–ป๊ฒŒ๋“ ', '๋Œ€ํ•ด', 'ํ—ˆ๋ฌด๋งน', '๋Œ€๊ทœ', '์ฃผ๋”ฑ์ด', '์‹œ์žฅ์„',
'ํ˜„์žฌ', '์•„๋ฐ”ํƒ€', '๋ฐฉ์†ก์„', '๊ทธ๋‚ ', '์ด๋ ‡๊ฒŒ', '์ƒํŒ', '์œ ๋™', 'ํŒŒ์ด๊ฐ€',
'์ดํ•ด', '๊ทธ๊ฒŒ', '๊ฑฐ๊ธฐ์„œ', '๋‚˜๋กœ์„œ๋Š”', '๋ฉด์ ‘', '์ข‹์œผ', '์ฒ˜์Œ', '๋งŒ๋“ค๊ณ ',
'๋ˆ„๊ตฌ๋„', 'ํ™•๊ณ ', '๋งํ•˜', 'ํŒ๋งค', '์†Œ๋น„', '๋งŒ์กฑ', '๊ณ ์ •', '๋ชจ๋ฅด๊ฒŒ',
'๊ณ ๋“ฑํ•™', '๊ธˆ๊ธฐ', '์šฐ์„ ', '๋…ธ๋ž˜๋ฅผ', '์–ด์˜', '๋ฐ›์€', '๋ฒ„์ธ„์–ผ', '์ œ๋Œ€๋กœ',
'๋Œ๊ธฐ', '์ฐธ๊ฐ€', 'ํŽธ์ง‘', '์‹ค๋ช…', '๊ด€๋ฆฌ', '์›€์ง์ด๊ธฐ', '๊ทธ๋Ÿฌ๋‹ค๋ณด๋‹ˆ', '์ผ๋‹จ',
'์ƒ๋ฐฉ์†ก', '๋ฐํžˆ', '๊บผ๋‚ด', '๊ฒƒ์ด๊ธฐ์—', '๋ฐฉ์†ก์ด', '์ด์Šˆ๊ฐ€', '๊ฑฐ์˜', '์ค‘๋…',
'์ฒซ๋‚ ', '๋ฐฉ์žฅ', '์˜ฌ๋ผ๊ฐ€๊ธฐ', '๋„๋ฐฐ๋˜๊ธฐ', '๋‚ด๊ฐ€', '๋“œ๊ฐ€', '๋‚จ์€', '์ฐ์€',
'์ค„์–ด๋“œ๋Š”', '๊ฑฐ๊ธฐ์—', '์ƒ๋‚จ', '์‹คํ–‰', '๋“ฃ์ž๋งˆ', 'ํ™•์ธํ•œ', '์ตœ๊ทผ', '์‹ค๋ ฅ์ด',
'๋ถ€๋žด', '๊ธฐ์กด์˜', 'ํ† ํฌ', '๋ฒ ํ…Œ', 'ํšจ๊ณผ๊ฐ€', '์• ๊ต๋ฅผ', '๋“ค์–ด์˜ค๋Š”', '์ž˜ํ•˜',
'์ถฉ์กฑ', '๋˜๊ธฐ', '๊ทธ๋•Œ', '์ตœ๊ณ ', '๊ทผ๋ฌด', '์žฅ๋น„', '์—†์œผ๋ฉด', '๋ฐœ์ „',
'์ด๋ฏธ์ง€๊ฐ€', '๋งค๋ ฅ์„', '๋ถ€๊ฐ', '์ด์šฉ', 'ํ•˜๋ฉฐ', '๋ณธ์ธ์˜', '๋จน๊ณ ', '์„ค๋ช…ํ•˜',
'์ด์ ', '๊ฒฝ์Ÿ', '์ดˆ๋ฐ˜', '์„ ๊ตฌ', '์„œ์•„', '๋Œ€๊ธฐ์—…', '์ „ํ™˜', '์‚ด์ง',
'๋„๊ฒŒ', '์•ฝํ•œ', '์ด๊ฑฐ', '์ปจํ…์ธ ', '๋ณด์ด๊ธฐ', '๋‹น์—ฐ', '์–ผ๊ตด๋„', '๋ŒํŒŒํ•œ',
'๊ธฐํšŒ๊ฐ€', '์ƒ๊ธฐ', '๋‚˜์ด๋ฅผ', '์ด์ œ', 'ํ›„์—', '์ด๋Ÿฌ', '์„ค๋งˆ', '์ƒํ™ฉ์„',
'์‚ฌ์ง„์ด', '๋ŒํŒŒํ•˜๋Š”', '์ค‘๋ฐ˜', '๋น„์Šทํ•œ', '๊ทธ๋งŒํผ', '๋ง๋ถ€ํ„ฐ', '๋ฌธ์ œ๊ฐ€',
'์ƒ๊ธธ์ง€๋„', '์•„๋ฌด๋„', '์ž‘์„ฑํ•˜๊ธฐ', '์ตœ์ดˆ๋กœ', '์ธ๋ฐฉ', '์ •๋ฆฌํ•˜', 'ํ•ด์ฃผ',
'ํ•ฉ๋ฐฉ', 'ํ™ฉ๊ธˆ', '์ •๋„', '์‹œ์ž‘ํ•˜', '์•„์ €', '์•„์กฐ', '์ดˆ๋“ฑํ•™', '์ด๊ฒƒ๋„',
'๋…ผ๋ž€์ด', '๋ ์ง€', '์™•์ฝ”', '์œ ๋ช…ํ•˜', '๋•Œ๋ฅผ', '๋‚˜๋Š”', 'ํ˜•์ด', '๋ˆ„๊ฐ€',
'์ธ์ง€๋„', '์ง€๊ธˆ์€', '๊ฐ‘์ž๊ธฐ', '์˜ˆ์ „', '์˜›๋‚ ', 'ํœด๋ฐฉ', '๋ฐ๋ท”๋ฐฉ์†ก',
'์ธ์›', '๋‚˜๋ฅผ', '์ด๋ฅธ', '์žˆ์œผ๋‹ˆ', '๋Œ€์ถฉ', '์น˜๋Š”', '๊ด€์‹ฌ์ด', 'ํž˜๋“ ',
'ํ™”์งˆ', '์‹œ์ž‘๋˜', '๋Šฅ๋ ฅ', '์˜ค๋””์…˜์„', '์žˆ๋‹ค๊ณ ', '๋งŽ์•„์„œ', '์„ฑ์žฅ',
'์• ์ดˆ', '๋”ฐ๋ผ', '์ง€์›', '๋ถˆํƒ€์˜ค๋ฅด๊ธฐ', '๋…ธ๋ž˜๋„', '๋„˜๋Š”', '๋‚™์ˆ˜๋ฅผ',
'์‚ฌ๋žŒ๋“ค์ด', '๋๋‹ค๊ณ ', '์‹œ์›', '์ƒˆ๋‹ฌ์ฝค', '์˜ค๋Š˜๋„', '๋ถ€๋“ค', '์œ ์น˜์›',
'๋งค๋‹ˆ์ €', '์ง“๊ถ‚์€', '๋ฐ”๊พธ', '๋ณด์ด๋Š”', '๊ฐ€์ง„', '์‚ฌ๋žŒ์€', '๋ฌด๋ ต',
'๊ทธ๊ฑธ', '๋ˆ์€', '๊ฒฝ๋ ฅ', '๋‹ค์„ฏ', '์‹ฑ์ˆญ', '๋‚ด์šฉ', '์ œ๊ฐ€', '์–ด๋ ต๊ฒŒ',
'๊ดœ์ฐฎ์œผ', '์˜ค๋””์…˜์ด', '์ˆซ์ž', '์™ธ์˜', '๋ฌผ๋ก ์ด๊ณ ', '์ ์–ด๋„', '๊ฒฐ์ฝ”',
'๋‹ฌํ•˜๋Š”', '์ผœ์„œ', 'ํ•œ๋‹ค๊ณ ', '๋Œ์–ด', '๋‹‰๋„ค์ž„์ด', '์‹ธ์š”', '๊ฐ€๋“ํ•œ',
'์ถ”๊ธฐ', '๋А๋ผ๋Š”', 'ํ•ด๋„', '๊ณ ๋ฐฑํ•˜', '๋‚˜์œ', '๋งŒ๋“ค์–ด', '๊ณต๊ฐ„์˜',
'๋‚ด๋†”๋„', '์ง์ ‘', '๋ฌด์—‡๋ณด๋‹ค', '์ ๋‹นํ•œ', '์ดˆ์žฅ', '๋•Œ๋Š”', '๋–จ๋ฆฌ๋Š”',
'ํƒ€๊ธฐ', '์™ ์ง€', '์ด๋ฆฌ', '์—ฐ๋ง', '๋ณธ์ธ๋„', '์ง„์งœ๋กœ', '์–ผ๋งˆ๋“ ์ง€',
'๊ฐ€๋ณด', '์—†๊ณ ', '๊ทธ๋ž˜๋„', '๋ˆˆ์ด', '๊ณผ๊ฐํ•˜๊ฒŒ', '๊ฐ์ธ', '์•Š๊ณ ',
'๊ณ ๋กœ', '์นจ๋ฌต', 'ํ์ง€', 'ํ„ฐ์ค', '์—†๋‹ค๊ณ ', '์ง€๊ธˆ๊ป', '์ด๋•Œ',
'์‚ฌ๋žŒ์„', '์ž‘์—…', '๋ˆˆ๋™', '๊ฐ–๊ณ ', '๋‚ด์„ฑ์ด', '๋””ํ…Œ์ผํ•œ', '์†Œ๊ฐœ',
'๋ฐฉ์†ก์˜', '์—†์ด', 'ํฌ๋ฃจ๊ฐ€', '์œ ์ž…์ด', '์•„๋‹Œ', '๊ฐ์ •์„', '๋Œ€ํ•œ',
'์—ฌ๋Ÿฌ', '๋“œ๋ฆฌ', '์‚ฌํšŒ', '๋งŽ์œผ', '๋ฏธ๋ฆฌ', 'ํ• ์ง€๋„', '๋‹ค์–‘ํ•œ',
'๊ณ ์‚ฌ', '์ด๊ฑด', '์•…์งˆ', '๊ฒƒ์„', '๊ทธํ† ๋ก', '๋ณต์žฅ', '์˜ฌ๋ฆฐ',
'๊ทธ๊ฒƒ์„', '์•„๋ฌด๋Ÿฐ', '๋ฌด์‹œ๋ฌด', '์žˆ์„์ง€', '์žˆ๋‹ค๋Š”', '์ดํ›„', '์Šฌ์Šฌ',
'๋ฐ›์„', '๋ชจ์—ฌ๋“ค๊ธฐ', '์˜ค์ „', '์˜ค๋žœ๋งŒ์—', '์ƒ๋Œ€๋กœ', '์‹ ์ฒญ', '๋๋‚˜๊ณ ',
'์ซ„๋ฆฌ๊ธฐ', '์‹ธ์›€์ด', '์˜ค๋Š˜์ด', '์–ด๋А์ƒˆ', 'ํ›„์›์„', '์ข…๋ฃŒ', '๋ณด๋‚ด์ฃผ',
'๋Šฆ์€', '๊ด€๋ จ', 'ํ–ˆ๋˜', '์ฒด๊ธ‰์„', '์ ์ ˆํ•œ', '๊ทธ๊ฒƒ์€', '๋ช…์˜',
'์‹œ๊ฐ„์„', '์ฃผ์ตœ', '๊ทธ๋งŒํ•œ', '์ผ์ผ์ง€๋„', '๋‚˜๊ฐ€', '๋“ฑ์˜', '์ž๋ฃŒ๋ฅผ',
'๋А๋‚€', '๋ช…์„', '์—ฌ์œ ๊ฐ€', '์‚ฌ์ „์—', 'ํ•œ๋‹ค๋Š”', '์• ์จ', '์›๋ž˜',
'๋‚ด๋Š”', '๋ช…์‹ค์ƒ', '๋‚˜๋‹ˆ', '์žํ™”', 'ํ”ผํ•ด', '์—†์—ˆ๊ณ ', '๊ทธ๊ฑด',
'๋ฐ›๊ณ ', '๋งˆ์น˜', '์‚ฌ์šฉํ• ', '์†Œํ†ต', 'ํ•˜๋‚˜๊ฐ€', '์ž…๊ณ ', '์ด์ƒ',
'๋ถ„์„', '๋ชฐ์ž…', '๊ฐ๋™', '๋ถ„์ด', 'ํ€„๋ฆฌํ‹ฐ๊ฐ€', '์ด์ „', '๊ธฐ์ˆ ',
'๋๋‚˜์ž๋งˆ', 'ํ†ตํ•œ', '์ž๊ธฐ์†Œ๊ฐœ', '์ƒ๊ฐํ• ', '๋‹จ์–ด๊ฐ€', '์„œ๋น„์Šค๋ฅผ',
'์ž ์‹œ', 'ํ™˜๊ธฐ', '์„ ๋ฐฐ', '์žˆ์œผ๋ฉด', '๋…ธ๋ž˜๊ฐ€', '์ž์„ธ', '๋…ธ๋ž˜์˜',
'์‚ฌ๋žŒ๋“ค์˜', '์ฃผ์œ„์˜', '๊ฐ€๋Š”', '์žˆ๋˜', '๋ดค๋˜', '์˜คํžˆ๋ ค', '์ด์•ผ๊ธฐํ•˜',
'๋ฐฉ์†ก์ ์ธ', '์†Œ๋ฌธ์ด', '๋„˜์น˜๋Š”', '๋“ค๊ณ ', '๋…ธ๋ž˜์ž', '๋ฌด๋Œ€๋ฅผ',
'๋‚ ์นด๋กœ์šด', '์• ์ฒญ', '์ดˆ์ฐฝ๊ธฐ', '๋ฌ˜ํ•œ', '์ˆ ๋ ์ด๊ธฐ', '๋„์ž…',
'์—†์œผ๋‹ˆ', '์•Š์€', '์ด์œ ๋กœ', '๋‹ค๋“ค', '๊ดœํžˆ', 'ํ™•์ธํ•˜', '์–ด๋งˆ๋ฌด',
'์ค‘์š”ํ•œ', '๊ฒƒ์ด๋ผ', '์ตœ์ ์˜', '์ถ”๊ฐ€ํ•˜', '์ƒ๊ธด', '์žˆ์–ด์„œ', '์ˆ˜๋งŽ์€',
'๊ฐค๋Ÿฌ๋ฆฌ', '๊ทธ๋‚˜๋งˆ', 'ํ…ƒ์„ธ๋ฅผ', '์ด๋“ค์€', '๋ถ€๋ถ„์„', '๋‚จ๋Š”', '๋Œ€์„ฑ',
'๊ฐ„๋‹จํ•œ', '์ Š์€', '์‘์›', '์•Œ์•„๋ณด', '์˜ค๋Š˜์€', '๋– ๋Š”', '๋”ฐ์ง€๋ฉด',
'์žˆ๊ธฐ์—', '์†Œ์œ ', '๋ณด๋Š”', '๊ทธ๋“ค์˜', 'ํœด์‹', '๋ฏธ์นœ', '์ตœ์ข…ํ•ฉ๊ฒฉ',
'์ถฉ๋ถ„ํžˆ', '์ง„์ง€ํ•œ', '๊ณผํˆฌ', '๋ง›์„', 'ํ•˜์ด๋ผ์ดํŠธ', '์ผ๋“ค์ด',
'์†Œ์ค‘ํ•˜๊ฒŒ', '์ง€๊ธˆ๊นŒ์ง€', '๋œจ๊ฑฐ์šด', '์—ฌ๊ธฐ์„œ', '์Šน๋ฆฌ', '์ƒ๊ฐํ•˜',
'๋‚จ์ง“ํ•œ', '์ˆœ๊ฐ„', '๋ƒ‰์ฒ ํ•œ', '์™€์„œ', '๋œ๋‹ค๊ณ ', '๊ธฐํšŒ์ฃผ์˜',
'๊ณ ์ง‘์„', '๋ฐ˜์‘ํ•˜๋Š”', '์•„์ด๋Œ์„', 'ํ™”๋ คํ•œ', '์ด์–ด์ง€๋Š”', '๊ทธ๋กœ',
'๊ธฐ์–ตํ•˜', '๋ณด๊ธฐ', '์ด๋ฒˆ์—๋Š”', '์ผ์ƒ', '๋งค์ผ', '๊ทธ๋Ÿผ', '๋ชฉ์†Œ๋ฆฌ๊ฐ€',
'๋ฌด๋Œ€๊ฐ€', '๊ฒน์น˜๋Š”', '์ค‘๊ฐ„', '์‰ฌ๋Š”', '๋จน์„', '๊ทผ๋ฐ', '๋ฐฐ์‹ ',
'์‚ดํŽด๋ณด', 'ํ•ฉ๊ฒฉ์„', '๋ฝ‘์„', 'ํ–ˆ๊ณ ', '์˜๊ฒฌ์„', '์ˆœ์‹๊ฐ„์—',
'์ด๋งŒํ•œ', '๋‚š์‹œ', '๋‹น์žฅ', '๋ฐฐ๊ฐ€', '๋งŒํผ', '์ผ์ฐ', '์ฐจ์ด๋Š”',
'์—ฐ์Šต', '๊ณผ๊ฑฐ', 'ํŒฌ๋ค์ด', '๋†“๊ณ ', '์ผ์ •์ด', '๋ถˆ๋งŒ์ด', '์š•๋ง์„',
'์ข‹์•„ํ•˜๋Š”', '์ˆ˜์ต', '์‹œ์ž‘๋ถ€ํ„ฐ', 'ํ™•์‹คํ•˜๊ฒŒ', '๊ทธ๊ฑฐ', '์žˆ์—ˆ๋˜',
'ํ›„์›๋ฉ”', 'ํ•ด๋‹น', '๋Œ์•„๋‹ค๋‹ˆ๋Š”', '๊ธฐ๊ฐ„์ด', '์ทจ๋ฏธ', '๋ชปํ•œ',
'๋“ค์–ด๊ฐ€', '๋‹ค๋‹ˆ๋Š”', '์•„๋ชฐ', '์•Š์•„์„œ', '์งง์€', '๊ทธ๋Ÿฌ์ž', '์—ฌ๋ก ์ด',
'๋Œ€์ƒ', '๋‚˜์˜ค๊ธฐ', '๋ฌด๋Ÿญ๋ฌด๋Ÿญ', 'ํƒˆ๋ฝ์„', '๋Š˜์–ด๋‚˜๊ธฐ', 'ํŒ์—',
'ํ•œ๋™์•ˆ', 'ํญ์†Œํ•˜๊ธฐ', '๋ง์”€ํ•˜', '๋ฒŒ์จ๋ถ€ํ„ฐ', '์‚ฌ๊ณผ', 'ํ–ˆ๊ธฐ์—',
'์•„๋ฌด๋ฆฌ', '๋“ฑ์žฅํ•ด์„œ', '๊ธฐํšŒ๋ฅผ', '์ง€์ผœ๋ณด', '๋Œ€ํ•™', '์กฐ๋ณ„๊ณผ',
'์ง‘์ค‘', '๋ฝ‘๊ธฐ', '์œ„๋กœ', '๋๋‚œ', '์–ผ๋ฅธ', '๊ฒƒ๋“ค์€', '์›”๋“œ๊ฐ€',
'์•ฝ์†๋œ', 'ํšŒ์˜๋ฅผ', '๋Œ์•„์˜ค', 'ํฌ์‹', '์ชฝ์ด', '๋ฐฉ์—', '์˜น๊ธฐ์ข…๊ธฐ',
'์งง๊ฒŒ', '์šฐ๋ฆฌ๋Š”', '๋ด์ฃผ', '์œ„ํ•ด', '์ƒ๋‹น', '๊ฐ•ํ‡ด', 'ํŒฌ๋ค์„',
'์ด๋ฏธ์ง€๋ฅผ', '์ œ์™ธํ•˜๊ณ ๋Š”', '์š•์‹ฌ์ด', '์ตœ์ดˆ์˜', '๋ณ€์ˆ˜๊ฐ€', '๋ณ€ํ™”๊ฐ€',
'๋‚ด๊ฒŒ', '๊ฒฝ์šฐ๊ฐ€', '์ €๋ฒˆ', '์‹œ์ž‘ํ•œ', '์€๊ทผํžˆ', '๋ถ€๋ฅด', 'ํ‰์†Œ๋ณด๋‹ค',
'์ฃผ์–ด์ง„', '๋ง์ด', '๊ดœํ•œ', '๊ฒฝ์šฐ์—๋Š”', '๋ถ€์กฑํ•œ', '์ž…์žฅ์—์„œ๋Š”',
'์•Š๊ฒŒ', '๋น„๊ต์ ', '๊ทธ๋Ÿฌํ•œ', '๊ทธ์•ผ๋ง๋กœ', '์ฝ˜์„œํŠธ', '๋ถ„์œ„๊ธฐ๋ฅผ',
'๋งˆ๋ƒฅ', '๋ฉํ•œ', '์ž”์—ฌ', '์ ์ ', '๋‚ฏ์„ ', '๋ชจ๋‘๋ฅผ', '์˜คํ”„๋‹',
'์ฐจ๋ฆฌ', '๋ชจ์Šต์ด', 'ํ›„๋ณด', '๋“ฑ์žฅํ•˜', '๋ฉ”์ธ', '์žก๊ณ ', '๊ฒƒ์€',
'์ธ์‚ฌ', '์ธํ„ฐ๋ทฐ', '๊ฐ์„ฑ์„', 'ํ•ด์†Œ', '๊ฐ•ํ–‰', '๊ฒฐ๊ณผ๋ฅผ', '๋งŒํ•œ',
'๋…ธ์ถœ', '๋ฐฉ๋ฒ•์ด', '์˜์ƒ์ด', '์ด์™•์ด๋ฉด', '์ผ์„', '์ด๊ฒŒ', 'ํ•˜์ฐจ',
'์—ฐ์žฅ', '๊ทธ๋“ค์ด', 'ํŒ์„', '๊ฑธ๋ฆฌ๋Š”', '์ดํƒˆ', '์ €๋„', '์ผ์–ด๋‚˜',
'์œ„ํ•œ', '๊ฑธ๋ฆฐ', '์˜ณ๋‹ค๊ณ ', '๋ฐฉ์…€', '๋ฒŒ์–ด์ง€๋Š”', '๊ตฌ๋งค', '์˜์•„ํ•˜๊ฒŒ',
'๋ถ€๋ถ„์€', '์š•์‹ฌ์„', '๋ˆ„๊ตฐ๊ฐ€๊ฐ€', 'ํ•ฉ๋ฅ˜๋ฅผ', '์ค€๋น„๋ฅผ', 'ํ†ตํ•ด',
'์ผ๊ฐœ', '๋จธ๋ฆฌ', '์‹œ๊ฐ„์ด', '๋ฏธ์„ฑ๋…„', '๊ฐ์ž๋„', '๋ชจ๋ฅด๋Š”', '๋ฏฟ์Œ์ด',
'์ดˆ๋ณด', '๋ณด๋‹ˆ', '๋‹ฌ์ด๋ผ๋Š”', '๋ชปํ•˜๋Š”', '๊ฑธ๊ธฐ', '์ข์€', '๊ทธ๋“ค์„',
'์žฅ๊ธฐ', '์Šฌ์ฉ', '๋†’์ด๊ธฐ', '๊ทœ์น™์ ์ธ', '๊ณ„์†ํ•ด์„œ', '์šฐ๋งคํ•œ',
'๋‹ฌ๋ฆฌ๊ธฐ', '์ •์‹ ๋ณ‘', 'ํƒ‘์‹ ๋ณ‘', '๋•๋ถ„์—', '๋ถˆ๊ตฌํ•˜๊ณ ', '๊ฐ์ž์˜',
'ํฌ๋ฃจ์˜', '๋ฉค๋ฒ„๋“ค์€', '๊ฒƒ์ผ์ง€๋„', '๋ฒˆ์”ฉ', '๋‹จ์ˆœํžˆ', '๋ณธ๊ฒฉ์ ์ธ',
'์ค€๋น„ํ•œ', '์‹ธ๋Š˜ํ•œ', '์—ฌ๊ณ ', '์ž๊พธ', '๋“ฃ๋Š”', '์ด๋ฆ„', '๋‹น์ฒจ',
'๋‚ ๋›ฐ๊ธฐ', '๋„˜๊ธฐ', '๊ณฐ๊ณฐ์ด', '๋งํ–ˆ๋‹ค', '๋ถ€ํšŒ์žฅ', '์ฝ”์ธ', '๊ฒฐํ˜ผ',
'์• ๋งค', '์‚ฌ์†Œํ•œ', 'ํŒ€์ด', '๊ฑฐ๋ž€', '์ตœ์ดˆ์ด', '๋‹คํˆผ์ด', '๋“ฏํ•œ',
'๊ทธ๋Ÿฌ๋ฉด', '๋ฆฌ๋”', '์„œ๋กœ์˜', '์ •๋ณด๋ฅผ', '์˜ˆ๋กœ', '๋”ฑํžˆ', '๋ชฉ์†Œ๋ฆฌ๋กœ',
'๊ฐ€์ž…', '๊ฒƒ์ฒ˜๋Ÿผ', '๊ฐˆ๋“ฑ์ด', '๋˜์ž๋งˆ', '์ •ํ•ด์ง„', '์—†์–ด์„œ',
'ํƒ„ํƒ„ํ•˜๊ฒŒ', '๋ง๋ถ™์ด', '๋„˜์–ด๊ฐ€', '๋Œ์•„์˜จ', 'ํ”„๋ฆฌ์นด', '์ˆ˜ํ˜œ',
'์ˆ˜์ž‘์„', '๋ชจ์Šต์„', 'ํƒ๋ฐฉ', '์†Œ์ค‘ํ•œ', '์—ฐ์• ๋ฅผ', '์ž๊ฒฉ์„',
'์ž์—ฐ์Šค๋ ˆ', 'ํšจ๊ณผ๋ฅผ', '๊ฒฝ๊ณ„์˜', 'ํ™œ์•ฝํ•˜๋Š”', '์ตœ๋Œ€ํ•œ', '์‹ซ์–ดํ•˜๋Š”',
'๋Œ“๊ธ€', 'ํž˜์„', '์•„์˜ˆ', '๋ฐฉ์†ก์€', '์ฐธ๊ต์œก', 'ํŽธํ•˜๊ฒŒ', '๊ฒŒ์ž„์ด',
'๋Œ€๊ฒฐ๋ฏธ์…˜', '์ •์ฐฉ', 'ํŒ์˜', '๋„๊ณ ', 'ํ™”๋ฉด', '๋ถ„๋“ค', 'ํŒฌ์„œ๋น„์Šค',
'๋์„', '๋“ค์–ด์˜ค์ž๋งˆ', '๊ฐ€๊นŒ์šด', 'ํŒจ๋ฐฐ', 'ํƒ‘์ด', '์€์ธ', '์ƒ์Šน',
'์ดˆ์‹ฌ', '๊ฑฐ๋ž˜ํ•˜', '์–‘ํ•ด๋ฅผ', '์ง„์ •', '๋‹น์‹œ', '์ถฉ๋ถ„ํ•œ', '์„ค๋“',
'๋“œ๋Š”', '๋”๋ถˆ์–ด', '๋ฌธ์ œ๋Š”', '๋ฉธ๋ง์ „์„', '๋ฐฉ์†ก๋ถ€ํ„ฐ', '๋งŽ๊ด€',
'์—†๋‹ค๋Š”', '์ „๊นŒ์ง€', '๋•Œ๋งˆ๋‹ค', '๊ทธ๊ฒƒ๋„', '๋•Œ๋กœ๋Š”', '์ˆ˜์ •',
'๊ทธ๋ž˜์•ผ', '์žฌ์ƒ', '์„ธ๋ ฅ์„', '์–ป๊ณ ', '๊ฐ€์ง€', '์ œ์™ธํ•œ', '์ผ๋กœ',
'์–ธ๊ฐ', '์˜จ๊ฐ–', '๋‹ฌ๋‹ค', '๊ต์œก', '์„œ๋ฒ„๊ฐ€', '์•Š์œผ๋ฉด', '์ฃผ๊ณ ',
'์–ธ๋‹ˆ', 'ํ‡ด์ถœ', '์‹œ๊ฐ„๋งŒ', '๊ทน๋Œ€ํ™”', '๋ˆ์ด', 'ํ™”์ œ์„ฑ์„', 'ํŒ์€',
'๋ชปํ•˜๊ณ ', 'ํƒˆํ‡ด', '๋ช…์ด', '์ˆ™๋ จ', '์•Š๋‹ค๊ณ ', '์ค€๋น„ํ•˜', '๋˜๋ฉด',
'์กฐ์‹ฌํ•˜', '์œ ํŠœ๋ธŒ', '์š”์ฆ˜', '์ตœ์†Œํ™”', '์กฐ๊ฑด์„', '์†์„', '๊ฒฝ์•…',
'์ž ์„', '์กฐ์„ ', '์ง„์ง€ํ•˜๊ฒŒ', '์ „์—', '์ˆ˜์ž…์ด', '์žˆ๋‹ค๋ฉด', '์„œ๋ฒ„๋Š”',
'๋ฐœํ‘œ', '๋ฐ”์œ', '์•Š์•„๋„', 'ํ•œ๋ฐ', '๋ฌด์š”', '๊ทธ์ €', '๋‚˜์˜ค๋ฉด',
'์‹ธ์šฐ', '๋˜๋Š”์ง€', '๊ฐ€์Šด์ด', '์„ฑ์‚ฌ', '๋‚ด์˜', '๊ฐ•์กฐํ•ด๋„',
'์˜์™ธ์˜', '๋งŒ๋‚˜', '๋นจ๊ฐ„์•ฝ์„', '์˜๋ฏธ๋ฅผ', '์ •๋ง๋กœ', '๋ณด์—ฌ์ฃผ๋Š”',
'์ž๋ฆฌ๊ฐ€', '๋ณด๋˜', '์œ ์ž…๋œ', '๋Œ๊ณ ', 'ํ˜ธ๊ธฐ์‹ฌ์ด', '์ดˆ๊ธฐ',
'๋ทฐ์–ด์‹ญ', '์ „์„', '์ž…์ฃผ', '์‹œ์ ˆ', '์ˆ˜์žฅ', '๋ชจ์ง‘', '๋‚˜๋จธ์ง€',
'ํƒ“์—', '์„ธ์ƒ์ด', '๊ถŒ๋ ฅ', '์ผ์€', '๋๋Š”์ง€', '๋ณด๋ฉด', '์›”๋“œ๋ฅผ',
'๋Œ€ํ™”์˜', '๋ฏธ๋ž˜๋ฅผ', '์ฐจ๊ฐ€์šด', '์—ด์–ด์ฃผ', '์˜ค๋ž˜์ „', '์žˆ๊ณ ',
'๋“ฑ์ด', '์†Œ๊ทœ', 'ํ›„๋ฐœ์ฃผ', '์ž…์„ฑ', 'ํšŒ๋ณต', '๊ทธ๋Ÿฌ๋‹ˆ', '์•ˆ์ •์ ์ธ',
'ํ‰์ฒญ', 'ํŒฌ๋“ค์ด', '์ˆ˜์ž…์ ์ธ', '๊ฒŒ์ž„์„', '์žฌํ™”๋ฅผ', '๋А๊ปด์งˆ์ง€๋„',
'์‚ฌ์šฉํ•˜๋Š”', '์ ‘์†', '์™ธ์—๋„', '์šด์˜', '์ œ์ž‘', '์˜ฌ๋ฆฌ', '์ž…๋ชจ',
'๊ทœ๋ชจ๋ฅผ', '๋ฐ•์ˆ˜', 'ํ•˜๊ธฐ', '๋ฐฉ์†กํ•˜๋Š”', 'ํฅ๋ถ„', 'ํ‚ค์ž๋งˆ', '๊ฒฝ๋ก€',
'์›ƒ์Œ์„', '๋ˆ„๋ฅด', 'ํ•ด์„ค', '์“ฐ๋Š”', '๋ฒŒ์–ด์ง€๊ธฐ', '๋ฐฉ์‹ฌ', '๊ฐœ๋ฅผ',
'๋ ˆ๋“œ', '์นผ๋‚ ', '๋ฐดํ”ฝ', '๋…ธ๋ฐฉ์ข…', '์ธํ„ด', '์ฑ„์šธ', '์˜ค๋Š˜์„',
'์žˆ์–ด๋„', '์•ˆ์ ˆ', 'ํŒŒ๋ฐ', '์žˆ๋Š”์ง€', '๊ฒจ์šฐ', '์ด๊ฑธ', '๋งˆ๋ฒ•',
'์Œ“์ด๊ธฐ', 'ํ•˜์—ฌ๊ฐ„', '๊ณ ๋ฅด', '์ฆ๊ฐ€', '์ฐจ์ด๊ฐ€', '์‹œ์ ', '๋‚˜์„œ',
'๋…ธ๋ ฅํ•˜๋Š”', '์กฐ๋ ฅ', '๊ทธ๋Œ€๋กœ', '๋‹ค์ด์•„๋ฅผ', '๊ด‘์งˆ์„', '์ž”๋œฉ',
'๋งˆ์ฃผ์น˜', '๋ฐฉํ•ด', '๋ฌธ์ œ๋ผ๋„', '๋ณผ์„', '๋ง‰์ƒ', '๋ฉ˜ํƒˆ', '๋‚˜๋ฆ„',
'๋ด๋„', '๋Œ€๋ถ€๋ถ„', '๋ฌด๋ฒ•', '๋ณ„๋ช…์ด', 'ํ•„๋‘๋กœ', '์•Œ๋ ค์ง€',
'์•„์ดํ…œ์„', '์ˆ˜๋ฉด', '์•„๋Š”', '๊ณ ๊ฐ', '๋…ธ๋™', '์ธ์‹์ด', '์ฃผ์ž…',
'๋‚˜์˜ฌ์ง€๋„', '๋ชจ์—ฌ์„œ', '๊นจ๋‹ฌ์€', '๋ณด์ž๋งˆ', '๊ธธ์„', '๋‚˜์˜ค์ž๋งˆ',
'๋ฉค๋ฒ„๋“ค์ด', '๋๊นŒ์ง€', '์žˆ์—ˆ์„์ง€๋„', 'ํ•˜๋Š”์ง€', '์„œ๋ฒ„์—', '๊ฑด์ถ•์„',
'์ปจํŠธ๋กค์ด', '์™„์„ฑ', 'ํ•˜๋ฃจ์•„์นจ์—', 'ํ˜ธ๊ฐฑ', '๋ฉ‹์ง„', '์žฌ๋ฃŒ',
'์„œ๋ฒ„์˜', '๋น„๊ตํ•˜๋ฉด', '์ข‹๋‹ค๊ณ ', '๋‚˜๋ž‘', '๋– ๋“ค๊ธฐ', '์‚ด์•„๋‚จ์€',
'๋กค๋“œ์ปต์„', '์ด๋™', '์–ด๋‘์šด', '๊ฒฝ์šฐ๋ฅผ', 'ํ•˜๋‚˜์˜', '๊ฐ‘์˜ท',
'์„ธ์ƒ์—', '์ถ”์ข…', '์˜ค์ž๋งˆ', '๊ธฐ๋Œ€ํ•˜๋Š”', '์‹ค๋ง', 'ํ›„๋ฐฐ', '๋ง‰๋Œ€ํ•œ',
'์˜คํ”ˆ', '๋ฌผ์–ด๋ณด', '๊ฒƒ๋ถ€ํ„ฐ', '๋‚จ์„ฑ', '๋ณด์—ฌ์ค€', '๋•Œ๋ ค', '๋‹ค๋ฅด๊ฒŒ',
'๊ตฐ๋ฐ', '์šฐ๋ฆฌ์˜', '์šฐ๋ฆฌ๊ฐ€', '์ง€๊ธˆ๋ถ€ํ„ฐ', '๊ทธ๋ฆฌ', '๋ฐ”๋ผ๋ณด๋Š”',
'๊ธฐ์Šต', '๋‚œ๋™์„', '๋งˆ์Œ์„', '์‹ถ์€', '์ž์œ ', '์›ํ•˜๋Š”', '์ธ๋งฅ์„',
'์‚ฌ์‹ค์„', 'ํฌํ•จ', '์ •ํ™•ํžˆ', '๋Œ์•„๊ฐˆ', '๋ชฐ๋ ค์˜ค๊ธฐ', '์นœ์ ˆํ•˜๊ฒŒ',
'๋ˆ„๊ตฌ๋‚˜', '๋ชป๋œ', '๊ด‘์งˆ๋ถ€ํ„ฐ', '์‹ธ์›€์„', '์•Š์„', '์ง€ํ•˜', '๋…ธ๋ฅธ',
'๋ฐ˜์ „', '์ฒด๊ธ‰์ด', '์ธ์—ฐ์„', 'ํ•˜์ž๊ณ ', '๋•Œ๋ถ€ํ„ฐ', '๋ฌด์กฐ๊ฑด',
'๋งŽ์•˜๊ณ ', '์—ฌ๋ก ์กฐ์ž‘์„', '๋“ฑ์„', '๋งํ• ์ง€๋„', '๊ธˆ์ง€', '๊ทธ๋Ÿด',
'์ „์ฒด', '๋“ค์–ด์„œ', '์„ ๋ฌผ', '์ •๊ทœ', 'ํ˜ผ์ž์„œ', '๋•Œ๋„', '๋ฉค๋ฒ„๋“ค์„',
'๋ณด์œ ', '์ง„ํ–‰์ผ', 'ํŒ์ด', '์ง€์ง€', '์šฐ์Šน', '๋กค์„', '๋“ฏํ•˜',
'๋ฐ”๋‹ฅ', '๋ฒ”์ฃ„', '๋”์šฑ', '์ •์ƒํ™”', '์ˆœ์ˆœํžˆ', '๋งค๋ ฅ์ ์ธ', '๋‚˜์˜ค๋Š”',
'๋ฐ์ด๋ฅผ', 'ํ–ฅํ•˜๋Š”', '๋ฒˆ์˜', '์ฐจ์˜ค๋ฅด๋Š”', '๋•Œ๊นŒ์ง€', '์ผ๋ถ€๋Ÿฌ',
'๋‹น๋‹นํ•˜๊ฒŒ', '๋‚˜๊ฐ„', '๋‚˜์™€์„œ', 'ํฌ์ƒ', '์—ฌ๋Ÿฟ', '๋ฐ–์—', '๊ฒฝ๊ธฐ๊ฐ€',
'์—ด๊ด‘', '์•„๊นŒ๋ถ€ํ„ฐ', '์„ค๋ช…์„', '๋ฐฉ๋ฒ•์„', 'ํ•˜๋‚˜๋กœ', '๋ณธ์ธ์ด',
'์•„์‰ฌ์šด', '๋ชจ์Šต์€', '์ง„์‹ฌ์ธ', '์กฐ๊ธˆ๋งŒ', 'ํ˜๋Ÿฌ๋‚˜์˜ค๊ธฐ', '์ „๋ถ€ํ„ฐ',
'์˜์ƒ์„', '๋ง๋„', '๋™์‹œ', '๊ทธ์ชฝ', '์ฒ ์ €ํ•˜๊ฒŒ', '๊ณณ์—', 'ํ๋ฆ„์ด',
'ํ˜„์—ญ', '๊ท€ํ•œ', '๊ฐœ์ธ', '๋น„ํ•ด', '๊ฒƒ๋“ค์ด', '์–ด์จŒ๋“ ', '์ง์›๋“ค',
'๊ฐํƒ„์„', '๋„“์€', '์žก๊ธฐ', 'ํญ์ฃผํ•˜๊ธฐ', '์ฑ™๊ธฐ', '์‹œ๋“ค', '์Šค์Šค๋กœ์˜',
'๋นผ๊ณ ', '์•Œ๋ฆฌ๋Š”', '์ง„ํ–‰ํ•˜', '๋ง์”€๋“œ๋ฆฌ', '๋ฝ‘์•„๋ณด', '๋Œ๋ ค์„œ',
'์ฐพ๊ธฐ', '์ •๋ฉด์Šน', '์‹œ์ƒ์‹', '๋งŽ์€์ง€', '์ธํ•œ', '์ข…์ผ', '์ด๊ฒƒ์ด',
'์ˆ˜์ƒ', '๋‚ด๋…„', '์ง€๋‚˜', '์˜ฌํ•ด', 'ํ‰๊ฐ€ํ•˜', 'ํ˜น์‹œ๋‚˜', '๋ถ„์œ„๊ธฐ๊ฐ€',
'ํƒ„์ƒ', '์ตœ์—ฐ์žฅ', '์••๋„์ ์ธ', '์•Š๊ฒ ๋‹ค๋Š”', '์•Š์•˜๋˜', '๊ฐ€๋ฆฌ',
'ํ‡ด์—ญ', '๋ธŒ์ด', '์•ˆ๋‚ด๋ฅผ', '๊ฐ€์„œ', 'ํญ๋ฐœ', '๋ฐ›์•„์„œ', '๊ฐ™๋‹ค๋Š”',
'๋ญ๊ฐ€', '๊ณต๊ฒฉ์„', '๋ณด๋ฉฐ', '์˜ฌ๋ผ์˜จ', '์ œ์™ธํ•˜๋ฉด', '์ทจ์นจ',
'๋นก์„ธ๊ฒŒ', '์•„์ง๋„', '์ž๊ธˆ์„', '๋…์žฌ', '์‚ฌ์—…', '๋ง๋กœ', '์นœ๊ตฌ๋“ค์ด',
'ํ•ด๋ด…', '๋‹ฌ๋ ค๋ณด', '์—ญ์‚ฌ๋ฅผ', 'ํ™•์‹คํ•œ', '๋งˆ์Œ์ด', '๋ญ๋“ ', '์„ฑ๋Œ€',
'์‚ผํ–‰', '์ฆ๊ธฐ๋Š”', '์ž์—…', '๊ทธ๋…€์˜', '๋ถ„๋ช…ํ•œ', '์˜ค๋น ', '๋ชฐ๋ž˜',
'์†Œ์ง„', '๋ฌด๋ ฅํ™”', '์›๊ฑฐ๋ฆฌ', 'ํ–ฅํ•œ', '๋ถ™์–ด๋ณด', '๊ณ ์กฐ', '๋˜์–ด์„œ',
'๋– ์˜ค๋ฅด๊ธฐ', '๊ณ„ํš์ด', '์ง„ํ–‰ํ•ด๋ณด', 'ํ‹ˆ์ƒˆ', '๋œป์„', '๋™์—…',
'๋งค๋ฒˆ', '๋ถ„์œ„๊ธฐ๋Š”', 'ํฌํ ', '๋•Œ์˜', '๊ธฐํšŒ์—', 'ํŠนํžˆ', 'ํ•œ์ฐธ',
'์˜ˆ์—ด', '์ค€๋น„ํ•ด์˜จ', '์ฆํญ', 'ํ–ˆ๋‹ค๊ณ ', 'ํ›„๋ฐ˜', '์˜ฌ๋ผ์˜ค๊ธฐ',
'๋ชปํ–ˆ๋˜', '๋–จ๊ธฐ', '์ค‘์—', '์ž๋ฃŒ๋“ค์„', '์ผํ• ', '์ผ๋ฐ˜์ ์ธ',
'์–ด์ฐจํ”ผ', '์กด์žฌ', 'ํŽ€๋”ฉ์˜', '์ˆ˜๋‡Œ', 'ํŽ€๋”ฉ์„', '์ˆ˜์ค‘๋„', '์ตœ๊ฐ•',
'์ง€๋‚œ', '๋‹จ์ฒด', '๋ฐฐํŒ…', '๊ฐœ๊ณ ', '๋“ค์–ด๋ณด', '์œ„์—', '๋‹คํ•ด๋ณด',
'ํŒฌ๋“ค์˜', '์ฑ„๋„์—', '์ง€๊ธˆ์˜', '์•ฝ๊ฐ„', '์–ด๋งˆ์–ด๋งˆํ•œ', '์ตœ์†Œํ•œ์˜',
'์ˆœ์„œ๋Œ€๋กœ', '๊ธฐ๋ณธ', '์žฌ์‚ฐ์„', '๋ญ”์ง€', '๋ง์„', '๋ช‡๋ช‡', 'ํŠน์ •',
'๊ฒฝ๋งค๋ฅผ', '๋ถˆ๋Ÿฌ', '๊ณ ์ƒ', '๋“ฑ์žฅํ• ', '๋ฐ›์•„๋ณด', '๊ต‰์žฅํ•œ',
'์ด๋†ˆ์˜', '์ฑ„ํŒ…', '์ฐพ์•„๋ณด', '๊ธฐ์„ ์„', 'ํƒํ•œ', '์•„์ง๊นŒ์ง€',
'ํž˜์ด', 'ํž˜๋‚ด', '๋ˆ๋„', '๊ฑด๋ฐ', 'ํฅํ–‰', '๋Œ์•„๊ฐ€๊ธฐ', '๋ชจ๋ฅธ๋‹ค๋Š”',
'์˜ฌ๋ผ์˜ค์ž๋งˆ', 'ํ˜‘๋ ฅ', '์ธ๊ธฐ๋ฅผ', '๊ฒฝ์šฐ๋„', '๊ธ‰ํ•˜๊ฒŒ', '๊ธ์–ด',
'๋‚ฉ๋“', '์ฐจ๋Ÿ‰', '๋‹นํ•˜๋Š”', 'ํ•ด์•ผ', 'ํŒฌ๋“ค์€', 'ํŒฌ๋“ค๋„',
'์ด์œฝ๊ณ ', '๋ฐ›๋Š”', '๋‚˜์˜จ', 'ํ•„์š”ํ•˜๋‹ค๊ณ ', '์ž๋ฆฌ์—', '๊นŠ์€',
'์ฐฉํ•œ', '๋ˆˆ์„', '์–ป์€', '๋Œ๋ฆฌ๋Š”', '์ง‘ํ•ฉ', '์—ด๋ฆฌ๋Š”', '์ผ์ธ',
'๋ฐ˜๋ฐ•', '๋ณด์ผ์ง€', '๋ฌด๊ธฐ', '๋ชจ๋‘๊ฐ€', 'ํ™œ์„ฑํ™”', '์ด๋“์„', '์ด๋Œ€๋กœ',
'์ค‘์š”ํ•˜๋‹ค๊ณ ', 'ํฌ์ธํŠธ', '๋ผ๋Š”', '์—…๋กœ๋“œ', '๊ฒƒ๋“ค์„', '์‹œ์ž‘ํ•ด์„œ',
'์ค‘๊ณ„๋ฅผ', 'ํ•˜๋˜', '๋†ˆ์ด', '๊ณ„์…จ', '์„œ๋ฒ„๋ฅผ', '์—„์ฒญ๋‚œ', '๋–จ์–ด์ง€',
'๊ธฐ์ž', '๋“ค์–ด์ฃผ', '์ „ํˆฌ๋ฅผ', '์กฐ์šฉํžˆ', '์–ด๋””์„œ', 'ํ•œ๋‹ค๋ฉด',
'์ž์‹ ๊ฐ์ด', '๋น„์Šทํ•˜๊ฒŒ', '๋Œ€๊ฒฐ์ด', '๋ง๊ณ ', '๊ฒฌ์ œ๋ฅผ', '์ ์ค‘',
'๊ฒฝ๊ธฐ์˜', '๊ฒฐ๊ณผ๋Š”', '์ž‘๋™', '์ค„์–ด๋“ค๊ธฐ', 'ํ›ˆ๋ จ', '์ ˆ๋Œ€๋กœ',
'ํ•˜์ž๋งˆ', '๊ฐ€๋ณ๊ฒŒ', '๋‹น๋ถ„๊ฐ„์€', '์กฐ๊ธˆ์ด๋ผ๋„', '๋ฒˆ์—', '์•Š๋Š”',
'๊ฒฝํ—˜์ด', '์ž์›์„', '๋‚ด๋ฆฌ', '์™ธ์น˜๋Š”', 'ํ•œ๊ป', '๋Œ€๋‹ดํ•œ',
'์ด๋ชจ', '๊ฝค๋‚˜', '์˜ค๊ธฐ', 'ํ™œ์•ฝํ• ', '์—„์ฒญ๋‚˜๊ฒŒ', '๋“ค์ž๋ฉด',
'๋„์ฐฉํ•˜', '์ƒํ™œ์„', '์–ด์จŒ๊ฑฐ๋‚˜', '์ƒˆ๋กญ๊ฒŒ', '๋ฏธ์—ฐ', '๊ตฌ๊ฒฝ์„',
'๋‹จ์ˆจ์—', '๋™์ผ', '์ •๋ณด๊ฐ€', '์ด๋‚ด', 'ํ‹ฐ์–ด', '์˜ํ–ฅ๋ ฅ์„',
'์—ญํ• ์„', '๊ฐ™์€๋ฐ', 'ํ›จ์”ฌ', '๊ฐ์ข…', '์น˜๋˜', '๊ทธ์˜', 'ํฌ๊ธฐํ•˜๊ณ ',
'์ธ์ƒ', '์ž…์žฅํ•˜', '๋‹ด๋‹น', '์ €ํฌ', '์ต์ˆ™ํ•œ', '๋ฐ๋ท”ํ•˜',
'๊ผฝ์•„๋ณด', 'ํ™œ๋™ํ•˜๋Š”', '๊ณต๊ฐœํ• ', '๊ต‰์žฅํžˆ', '๋ฐ›์œผ', '๋‚จ์ž',
'๊ฑท๊ธฐ', '์˜ˆ์„ ', '๋งˆ๊ฐ', '๋ฉ‹์ง€๊ฒŒ', '์ž๊ธ‰', 'ํŒ€์›๋“ค', 'ํŒฌ๋ค๋“ค',
'๋ฒ”์œ„', '์•ˆ์ ธ', '๋†’๋‹ค๊ณ ', '๋งค์žฅ', '์‚ฌ๋žŒ๋“ค๋„', '์•”์‚ด', '๋ถ€๋ถ„์ด',
'๋ฏธ๋“œ', '์ปค๋‹ค๋ž€', '์ฐจ์˜ค๋ฅด๊ธฐ', 'ํŒŒ์•…ํ•˜', '์ตœ์•…์˜', '๋†’๊ณ ',
'๊ฐœ๋ฐœ', '๊ธฐ๋‹ค๋ฆฌ', '์‹œ์ฆŒ', '์ฑ„๋กœ', '๋˜๊ณ ', '์‹ฌํ•˜', '์–ด์šธ๋ฆฌ๋Š”',
'์ฐจ๋ก€', '๋ฒŒ์–ด์งˆ์ง€', 'ํŠน๋ณ„ํžˆ', '๋ฐ์ดํŠธ', '์•Œ๊ฒŒ', '๊ฑด์ง€',
'ํŒ€์„', '๊ฐ™์•„์„œ', '์ƒ๊ฐ๋ณด๋‹ค', '๋งˆ์Šคํฌ', '์จ์„œ', '์‹์‚ฌ๋ฅผ',
'์ €๋Š”', '์น˜ํ‚จ', '์—ฌ์œ ๋ฅผ', '์‹œ๊ธฐ๋ฅผ', '์ž ๊น', '๊ฒฝ๊ธฐ๋ฅผ',
'๊ธฐ๋Œ€๋ฅผ', '๊ฒŒ์ž„์˜', 'ํŒ€์€', '๋‹ค์Œ์—๋Š”', '๋ฐฉ์†ก์—', '์ด๋ฒˆ์—๋„',
'๋งจ๋‚ ', '์ž์‹ ๋„', '์น˜๊ธฐ', '์Šคํ‚ฌ', '์ด๋‹ˆ', 'ํ•˜๋‚˜์”ฉ', 'ํ•„์š”ํ•œ',
'๊ด€๊ณ„', '๊ฒฐ์Šน์ „', '๊ฐ–๋Š”', '์ฆ๊ฑฐ์šด', '์• ๋“ค์ด', '์ค‘์š”ํ•˜๊ฒŒ',
'๋‚˜๋ฉด', '์ฐพ๋Š”', '๊ณ ๋ชจ', '๊ฐ€๊ฒฉ์„', '๊ทธ๋ ‡๊ธฐ์—', '์‚ฌ์‹ค์ด',
'๋“ค๊ธฐ', '์‚ฌ๋Š”์ง€', '์ฆ๊ฑฐ', '์•Œ์•„์„œ', '์—ด๊นŒ์ง€', '์ค€๋น„๊ฐ€',
'๋„‰๋„‰ํ•œ', '์˜ค๋žซ๋™์•ˆ', '๋А๊ธ‹ํ•˜๊ฒŒ', '๊ณต์šฉ', '๋จน์–ด๋„', '๊ฐ•ํ™”',
'๋งˆ์Šคํ„ฐ', '์ง์—…', '๋ฐฐ๋‹ฌ์„', '์ƒ์กด', '์ƒ๊ฐํ•ด๋ณด', '๋งŒ์—',
'๋๊ณ ', '์™„๋ฒฝํ•œ', '์นญํ˜ธ๋ฅผ', '์‚ฌ๋ƒฅํ„ฐ', '์ฆ๊ฒจ์ฐพ๊ธฐ', '์กฐ๊ธˆ์”ฉ',
'๊ทธ๊ฒƒ์ด', '์†๋ชฉ', '์‹œ๊ฐ„์—', '์ผ€์ดํฌ', '์ „์ง', '์‚ฌ๋ง',
'๋†๋ถ€', 'ํž˜๋“ค๊ฒŒ', '๊ฐ€๋Šฅํ•œ', '๊ฐ•์ฒ ', '๋น„์šฉ์„', '๊ฐ•๋ ฅํ•œ',
'๊ทธ๋ฆผ์„', '์ ๊ฒ€', '๋ฐœ๊ฒฌ', '๊ตฌ๊ฐ„', '์•ฝ์†ํ•œ', 'ํ•˜๋‚˜๋ฅผ',
'์š”๋ฆฌ๋ฅผ', 'ํš๋“', '๋’คํ†ต์ˆ˜๋ฅผ', '๊ฐ์‹œ', '๋ฒ ์ŠคํŠธ', '๋ ˆ์ด๋“œ',
'์–ผ์Œ', '์–‘์ธก', '์›Œ๋‚™', 'ํ’€๋ฆฌ๊ธฐ', '์ฐจ๋ผ๋ฆฌ', '๋“ค๋ ค์˜ค๊ธฐ',
'์•Œ๋‹ค', '์••๋„ํ•˜๊ธฐ', '์•Œ๋ ค์ฃผ', '๋ฐ›๊ธฐ', '์ตœ๋‹จ', '์ด์•ผ๊ธฐ๋ฅผ',
'ํ™”์ œ๋ฅผ', '์ฒญ์†Œ', '๋งค๋‹ฌ๋ฆฐ', '์›์ž‘', 'ํ™œ๋™์„', '๋‹จ์ผ',
'์†Œ๋…€', '์ฃผ์ฃผ', '๋„์ „์„', '์œ ๋ฆฌ', 'ํ•œ๊ตญ', '์˜ฌ์ง€๋„', '๊นŠ๊ฒŒ',
'ํŒŒํ‹ฐ', '๋Œ€ํšŒ', '์ „๊ตญ', '๊ตญ์ œ', '์Šคํƒฏ', '๊ฐœ์ฒ™', '๋„ˆํ”„',
'์ง„ํ™”', '๋†€์ดํ„ฐ', 'ํžˆ๋“ ', '์•ˆ๋…•ํ•˜', '์„ฑ์„', '์ด์ด', '์ €์ €',
'๊ทธ๊ทธ', '์•„์•„', '์œผ์œผ', 'ํฌํฌ', 'ํํ', 'ํžˆํžˆ', 'ํ—คํ—ค',
'ํ˜ธํ˜ธ', 'ํ•˜ํ•˜', 'ํ—ˆํ—ˆ', 'ํ›„ํ›„', 'ํœดํœด', '์บฌ์บฌ', 'ํ‚คํ‚ค',
'ํ‘ธํ•˜', 'ํ”ผ์‹', '์—‰์—‰', 'ํ‘ํ‘', 'ํ›Œ์ฉ', '๊บผ์ด', 'ํ†ต๊ณก',
'์งˆ์งˆ', '๋ป˜๋ป˜', '์ค„์ค„', '๋š๋š', 'ํŽ‘ํŽ‘', '์ฝธ์ฝธ', '์กธ์กธ',
'์ฃผ๋ฅต', '์ฃผ๋ฅด', '๋น„๋น„', '์“ฑ์“ฑ', '์‹น์‹น', '๋ฐ˜์ง', '๋ฒˆ์ฉ',
'๊นœ๋นก', '๋„๋•', '๊ฐ€์›ƒ', '๊ธฐ์›ƒ', '๋‘๋ฆฌ', 'ํž๋”', '์Šฌ์ฉ',
'์‚ด์ง', 'ํ™œ์ง', '๋ฐฉ๊ธ‹', '์‹ฑ๊ธ€', '๋ฒ™๊ธ€', 'ํ”ผ์‹', 'ํ‚ฅํ‚ฅ',
'๊น”๊น”', '๊ป„๊ป„', 'ํ•˜ํ•˜', 'ํ˜ธํ˜ธ', 'ํžˆํžˆ', 'ํ—คํ—ค', 'ํ›„ํ›„',
'์œผ์œผ', 'ํฌํฌ', 'ํํ', '์บฌ์บฌ', 'ํ‚คํ‚ค', 'ํ‘ธํ•˜', '์—‰์—‰',
'ํ‘ํ‘', 'ํ›Œ์ฉ', '๊บผ์ด', 'ํ†ต๊ณก', '์งˆ์งˆ', '๋ป˜๋ป˜', '์ค„์ค„',
'๋š๋š', 'ํŽ‘ํŽ‘', '์ฝธ์ฝธ', '์กธ์กธ', '์ฃผ๋ฅต', '์ฃผ๋ฅด', '๋น„๋น„',
'์“ฑ์“ฑ', '์‹น์‹น', '๋ฐ˜์ง', '๋ฒˆ์ฉ', '๊นœ๋นก', '๋„๋•', '๊ฐ€์›ƒ',
'๊ธฐ์›ƒ', '๋‘๋ฆฌ', 'ํž๋”', '์Šฌ์ฉ', '์‚ด์ง', 'ํ™œ์ง', '๋ฐฉ๊ธ‹',
'์‹ฑ๊ธ€', '๋ฒ™๊ธ€',
# Common Korean Particles and Endings (often attached to nouns)
'์€', '๋Š”', '์ด', '๊ฐ€', '์„', '๋ฅผ', '์—', '์˜', '์™€', '๊ณผ',
'๋„', '๋งŒ', '๋กœ', '์œผ๋กœ', '๊นŒ์ง€', '๋ถ€ํ„ฐ', '์—๊ฒŒ', 'ํ•œํ…Œ', '๊ป˜',
'์—์„œ', '๋กœ์„œ', '๋กœ์จ', '๊ฐ™์ด', '์ฒ˜๋Ÿผ', '๋งŒํผ', '๋ณด๋‹ค', '๋งˆ๋‹ค',
'์กฐ์ฐจ', '๋งˆ์ €', '์ปค๋…•', '๋ถ€ํ„ฐ', '๊นŒ์ง€', '์ด๋‚˜', '๋‚˜', '์ด๋ผ๋„',
'๋ผ๋„', '์ด๋‚˜๋งˆ', '๋‚˜๋งˆ', '์ด์•ผ๋ง๋กœ', '์•ผ๋ง๋กœ', '์ด๋ผ์•ผ', '๋ผ์•ผ',
'๊ณ ', '๋ผ๊ณ ', '๋‹ค๊ณ ', '์ž๊ณ ', '๋ƒ๊ณ ', '๋ผ๊ณ ', '์ด๋ž€', '๋ž€',
'๋ฉด', '์œผ๋ฉด', '๋‹ˆ', '์œผ๋‹ˆ', '๋‹ˆ๊นŒ', '์œผ๋‹ˆ๊นŒ', '๋Š”๋ฐ', '์€๋ฐ',
'ใ„ด๋ฐ', '์ง€๋งŒ', '์ง€๋งŒ', '๋”๋ผ๋„', '์•„๋„', '์–ด๋„', '์—ฌ๋„',
'๊ฒŒ', '๋„๋ก', '๊ณ ', '๋ฉฐ', '๋ฉด์„œ', '์œผ๋ฉฐ', '์œผ๋ฉด์„œ', '์ž',
'์ž๋งˆ์ž', '๋‹ค๊ฐ€', '๊ธธ๋ž˜', '๊ธฐ์—', '๋ฏ€๋กœ', '์Œ์œผ๋กœ', '๋А๋ผ๊ณ ',
'๋”๋‹ˆ', '์•˜๋”๋‹ˆ', '์—ˆ๋”๋‹ˆ', '๋‹ค๋‹ˆ', '๋ผ๋‹ˆ', '๋ƒ๋‹ˆ', '์ž๋‹ˆ',
'๊ฒŒ', '์ง€', '๊ณ ', '๊ธฐ', '์Œ', 'ใ…', '๊ธฐ', '์ด',
'๊ฐœ', '๋Œ€', '์žฅ', '๋ช…', '๋ถ„', '๋งˆ๋ฆฌ', '๊ถŒ', '์ž๋ฃจ',
'์†ก์ด', '๋ณ‘', '์ž”', '๊ทธ๋ฆ‡', '์ ‘์‹œ', 'ํ†ต', '๋ฐ”๊ตฌ๋‹ˆ', '์ƒ์ž',
'๋ด‰์ง€', '์ผค๋ ˆ', '์Œ', '๋ฒŒ', '์ฑ„', '๋™', '์ธต', 'ํ˜ธ',
'์„ธ', '์‚ด', '๋…„', '์›”', '์ผ', '์‹œ', '๋ถ„', '์ดˆ',
'์›', '๋‹ฌ๋Ÿฌ', '์—”', '์œ ๋กœ', 'ํผ์„ผํŠธ', '์ ', '๋ฐฐ', '๋ฒˆ',
'ํšŒ', '์ฐจ', '๋“ฑ๊ธ‰', '๊ธ‰', '๋‹จ๊ณ„', '์œ„', '๋“ฑ', '๊ฐœ๊ตญ'
}