首页 > 教育 > 问答 > 教育经验 > 基于句子音频和文本特征确定,什么是文本特征

基于句子音频和文本特征确定,什么是文本特征

来源:整理 时间:2022-04-03 15:02:40 编辑:教育知识 手机版

文字可以脱离一定的上下文和语境孤立地出现,叫文字的“孤离性”。拼音文字这一类音位文字,也有“孤离性”,表现在以词定型上。汉字的“孤离性”,表现在以语素定型上,而且这种特性强于音位文字,也就是拼音文字。三第二,汉字这种语素文字具有音义二维性。严格来说,所有文字都有形、音、义。没有“形”,写不出来;没有音义,不成为文字。

但是,拼音文字,需要通过语音中介和语义形成联系。汉字,则是形体本身同时与音、义发生联系。汉字形、音、义的这种联系,具体表现是汉字专字专用——形与义的联系,具有特定性;形与音的联系,不具特定性。比如,“虎”,现在读“hu”,古时或者在某些方言中,就不读“hu ”。但是,所有古代现在的人,都明白“虎”字之义。

进一步说,“hu”这个音,有很多同义字,但每个字都对应着自己的字义,也是所有人一看到发这个音的不同的字,也都能明白不同的含义。不识字的情况除外。所以,现在的人们,读起唐诗宋词,明白大意不成问题。对于更早的,比如《诗经》中的诗,需要补充的也只是古汉语常识。四第三,汉字大多是形声字,对于“识”和“读”有重要意义。

按照许慎《说文解字》的总结,篆体以前的古汉字造字,秉承了“六书”的原则。后来,有人将“六书”概括为四种构字法,也有人归纳为三种。秦汉时期,篆体发生了隶变,逐渐成为隶书和楷书。这个过程中,汉字笔画发生了巨变。但是,当初最初造字的“理据”依然存在。现在的汉字中,形声字超过90%。通用字中的“形旁”,大约有240多个。

这些“形旁”的作用,一是提示,二是区别。比如,元素周期表汉字记录的105个元素,其中有104个形声字,11个从“气”;10个从“石”;81个从“钅”,这就区分了气体元素、金属元素和从“石”的非金属元素。而“溴”和“汞”,又作为液体元素与固体元素相区别。所以,正如有人概括的,“见山之旁知山,见水之旁知水”。

形旁的这种区别作用,尤其突出表现在同音字上。通用字中的“声旁”,有1300多个。起作用,一是示音;二是示源。例如,媚、楣、嵋、湄,均来自“眉”的音,字义也从之而来;撕、厮、嘶、澌,皆来自“斯”的音,字义也与之分不开,等等。当然,形声字“声旁”的示音作用,与拼音文字的字母表音不同。“声旁”虽然记录的也是音节,但与拼音文字的字母与音节一一紧密对应有很大区别,而且,一个“声旁”可以记录多个音节,或前后发生变化。

因此,“声旁”的示音,不如拼音文字准确、方便。五第四,汉字是语素文字,由汉语决定又分为四个语调,因此,既使汉字具有了独特的音韵美,又可以承载更多的文化传统。这一点,不用过多讲述,唐诗宋词就是很好的例证。再比如,初唐四杰的王勃一篇《滕王阁序》,蕴含了几十个历史典故,出了几十个成语,也是很好的例证。第五,汉字是方块字,结构复杂。

文章TAG:文本特征音频句子基于句子音频和文本特征确定什么是文本特征

最近更新