Қазақ тілінің ғажап білгірі Жағда Бабалық, қазақта көмейден құлаққа дейін екі жүз сөз бар дейді - ©anatomynote.com
©anatomynote.com

Көмейден құлаққа дейін – екі жүз

“…Қазақ тілінің ғажап білгірі Жағда Бабалық, қазақта көмейден құлаққа дейін екі жүз сөз бар дейді. Ал біз қаншасын білеміз? Жақсы, мұрын, құлақ, көз бен шаш, сосын тағы аздап. Ол болса – екі жүзін біледі…” Г. Бельгер

Осынша байлық қазір қайда? Жақсы, тіліміздің ұшында болмасын, ең болмаса жазба ретінде қайда?

Соңғы мәліметтер бойынша, қазақ тілінде 5 млн-ға(!) жуық сөз болуы мүмкін екен. Қазақ сөздері 1937 жылдан бастап картотекаға жинала бастаған. Дәл қазір, ең болмаса “Цифрлы Қазақстан” аясында қоғамға лақ еткізе салса тамаша емес пе.

Бірақ. Бірақ ол картотеканың қазір қайда екені белгісіз. Барлығына жауап бере алмаймын, бірақ мен сұраған лауазымды адамдар білмейміз деді. Тіпті бұл жәйтті менен естіп тұрғандарын айтты. Біздің мәдени мұрамыз өзі шатыры берік қораға жарымай-ақ қойды ғой. Бұрын алтын қор болып есептелетін видеомұрағатты да жаңбырға ағып кетті деген болатын.

Қытай өз тілінің сөздерін… 2 300 жыл(!) бойы жинап келеді екен. 1968 жылдары бұл тілдегі түбір сөздердің қоры 500 мың болыпты. Қазір осынша байлықтың электронды түрде бар екеніне кәміл сенімдімін. Дайын сөздік қоры – дауыспен мәтін теруден бастап, роботтарға команда беруге дейінгі алғышарт. Жаппай автоматизация дәуірінде роботтар тек ұқыпты жиналып, сауатты индексацияланған, сөздер арасындағы контекстік байланыстар айқын көрсетілген тілде ғана сөйлейді. Меніңше, біз электронды тілдік қорды жасауға ышқына кірісуіміз керек. Асығуымыз керек.

Ерлан Оспан