• 1.37 MB
  • 2022-04-29 14:27:03 发布

教学课件PPT数字印前图形文字处理技术

  • 105页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'第三章数字印前图形文字处理技术 第一节数字印前图形处理机理和技术第二节数字印前文字处理机理和技术主要内容:第三节文字和图形的存储格式 通常是由人工创作绘制或由计算机图形软件设计绘制生成,而不是从客观世界直接获取。图形(Graphics)原稿对比图像:色彩与阶调都连续变化图形:由一个个相互独立的图形对象组合而成,而这些图形对象又可以由点、线、面、体等几何元素和填充色、填充图案等构成文字是特殊的图形,在计算机内以编码的形式处理,输出时对字形的描述与图形类似。 第一节数字印前图形处理机理和技术一、图形页面定位描述二、矢量图形的属性参数 一、图形页面定位描述1、矢量图的概念在计算机中表示图形的方法有两种:矢量法,也称为参数法以计算机中记录图形的定位参数(几何参数)和属性参数(非几何信息)来表示。点阵法,也称栅格法例如用扫描仪扫描图形,获得的就是这种表示方法的图形。严格地说计算机领域只能把第一种描述方法的图形称为图形或矢量图。而把后一种称为像素图或栅格图,有时也混称为图像。本章介绍的是参数矢量图。 值得一提的是即使是矢量图,很多输出设备上输出时,由于输出设备是用像素点组成的,只能将其转换为像素图输出,例如显示屏、激光照排机等。矢量图形的定义:矢量图形是由一个个相互独立的图形对象组合而成,而这些图形对象又是由标记点、线条、面、体等几何元素和填充色、填充图案等构成。矢量图形的表现:在计算机显示屏幕上,图形的最显著的外在特征是每一个图形对象都是一个独立的实体,它们可以在画面上重叠,但又可以通过选择工具把它们重新分开。 矢量图形的特点:使用数学公式和定位数据来描述诸如点、线条等基本元素和复杂的组合图形对象,矢量图尺寸的任意变化,都不会损失图形本身的质量。任何一个图形对象都有一套自己独立的描述数据,并分别独立存在。因此,它们知道自己的形状,知道自己与相邻图形之间的关系(如压盖关系、相交关系等)。 (1)点点是构成矢量图形的最小单位,一系列点的XY坐标集定义了对象的形状和大小,坐标点不可见,但它确实存在,并控制全局,当需要对图形进行修改时,必须首先选取点,当点被选取时,呈可见状态。在印前出版软件中,点可以分为端点、平滑点和角点。端点、平滑点和角点 (2)路径路径是使用印前软件创建的待着色的任何线条或形状。一条直线、一个长方形和一幅图的轮廓都是典型的路径。路径既可以是开放的,也可以是封闭的。封闭的路径是一条连续的、没有起点或终点的路径。开放路径的开始和最后结点叫做端点,两个端点不重合。(3)填充路径可以填充。对于封闭路径,填充区域为封闭的区域,如果填充一条开放路径,程序将在两个端点之间绘制一条的线条路径并且填充组合后的路径,后为填充增加的路径是不着色的,因此不可见的。 路径和填充 线划图一般都以矢量形式表示,这是因为矢量图有许多优点矢量图数据量小,处理速度快,存储和数据传输方便。矢量图能够把自己看做是对象,容易处理图形之间的相互关系,因此,几何要素编辑灵活。图形精细度高,以任意比例缩放都不会降低图形的质量,输出分辨率只受输出设备的影响。在任何输出设备上,基于矢量的图形都能以机器的最高分辨率输出。 2、图形软件概述图形软件通常可以分为两类:通用编程软件包和专用应用软件包。通用编程软件包提供一个可用于高级语言如C语言的图形功能扩展集(如教材上介绍的“VisualC++中MFC库以CDC类作为它的基本图形类,包含有许多成员函数。CDC类提供了画点、线等图形的成员函数。”),通用图形软件包包括生成图元,设置色彩和亮度值等基本功能。通用图形软件包是面对程序员的软件包,而专用图形软件包是面对非程序员设计的,由于它的应用领域不同,所以除了能生成图形外,还有其他的专用功能。 例如,印前图形软件Illustator就是专用图形软件,它中间就含有专用的图形生成编辑的图形软件包,由于它多半是用于广告创意设计,它的图形定位精度相比地图制作的图形软件(ArcInfo)和计算机辅助设计的图形软件(AutoCAD)要差,但是它的所见即所得(反走样,色彩)要比其他强。这说明专用图形专用软件包用于不同的领域,特点是不同的。 (1)图形软件的坐标系统图形软件是用坐标值来描述图形并定位图形的,在图形描述过程中常见的坐标系有用户坐标系,设备坐标系和规范化设备坐标系。用户坐标系用户坐标系为用户处理自己的图形时所采用的坐标系,所用单位用户自己决定,是用户熟悉的坐标系。例如在印前系统,PS的页面描述模式就是印前常用的坐标系。它以页面左下角为坐标原点,坐标的度量单位为1/72英寸(磅)。一张标准的8英寸×11英寸的页面为612磅×792磅。PS的坐标系统可以移动旋转。 设备坐标系与一个图形设备相关联的坐标系叫设备坐标系。例如常用的显示屏的坐标系常以分辨率为坐标单位,而原点在左上角。激光照排机的坐标单位为DPI。需要注意的是输出设备的坐标值均为正整数。文件中的用户坐标如果要输出,必须转换成设备坐标系才行。 对于印前这种具有多种图形设备的图形处理系统,采用规范化设备坐标系是非常必要的,它可以被看成一个抽象的设备,要输出到具体设备只要作适当的变换即可。设备驱动器用于变换规范化设备坐标系到整数设备坐标。规范化设备坐标系把各个设备坐标系中的数据经过变换化为统一的数据范围得到规范化设备坐标系。 (2)矢量图形的绘制绘制图元图形软件提供将称为图元的基本几何结构(包括已经介绍的点、直线以及矩形、圆、椭圆、圆弧、Bezier曲线和样条曲线等)组合成复杂结构图形的功能。每个基本图元由输入的坐标数据以及属性数据(包括色彩、线型以及点符的大小等)来指定。矢量数据的结构相互关系——拓扑关系绘制图元的基本原理计算机绘制图元的实质是将程序提供的这些图元的坐标位置转换成所使用设备的相应操作。 例如,如果用CRT监视器输出,就是按输入的坐标位置打开电子束以在选中的位置上照亮屏幕。如果是用激光照排机输出,则将输入坐标对应到设备的曝光网点上,打开这些网点的曝光光源,在胶片相应的位置上曝光,形成影像。由于一般的输出设备,包括显示器、激光照排机的显示方式都是由点阵排列的像素点组成,为光栅图形系统。所以,必须将图形的基本几何结构算法,转换成相应的像素图形才能输出。这一过程被称为扫描转换,是图形输出的关键。RIP就是完成这一功能的设备。绘制图元的基本原理就是将由数学公式表示的图形按照一个个基本图元进行扫描转换。(详细的每个图元的扫描转换方法可以参考《计算机图形学》,王选、北印的王克蒙都从事这方面的研究。) 练习 (3)矢量图形的修改变化利用显示输出图元及其属性的程序,可以生成各种复杂的图形。在很多情况下还要对已经创建的图形进行修改或变化。基本的变化有平移、旋转、缩放和反射等。平移平移是通过在原始坐标位置(x.y)加上平移距离(tx,ty)来实现的,是一种不产生变形的钢体变换,即对象上的每个点移动相同数量的坐标。直线的平移是将平移距离加到每个端点上,并且重画新端点之间的线段,多边形平移是将平移向量加到每个顶点的坐标位置上,按新的顶点坐标组重新生成新的多边形。 旋转像平移一样,旋转也是一种钢体变换,对象上的所有点都旋转相同的角度。同样,直线的旋转是将旋转方程用于每个端点上,然后重画新端点之间的线段,多边形旋转是将旋转方程用于每个顶点的坐标位置计算,按新的顶点坐标组重新生成新的多边形。应该注意的是确定旋转中心才能确定旋转方程中的参数。缩放缩放改变物体的尺寸,可以通过将直线的端点或多边形的顶点乘以缩放系数来实现。但是必须选择一个缩放后位置不变的点(称为固定点)来控制缩放对象的位置。 (4)Bezier曲线Bezier(贝塞尔)曲线是法国汽车公司的贝塞尔(PierreBezier)于上世纪70年代初创建的。它最早仅仅用于控制机械裁切设备一种数控方法。在Bezier曲线没有用于绘图软件之前,计算机在模拟现实曲线方面的能力是不足的,因此绘制任意路径方面一直是一个难以逾越的难题。Adobe公司的软件设计大师们敏锐地洞察到贝塞尔曲线描述任意路径的便利性,首先将贝塞尔曲线用到Illustrator软件中获得了极大的成功。Illustrator软件创建路径的方法是基于贝塞尔曲线的基本原理。现在它也成了高端图形设计软件的基础理论。 方向线节点节点方向线方向点任意一段曲线都可以使用四个点创建法,其中两个位于线段的两端。被称为节点(锚点,Anchor)。两个浮动于曲线段的旁边被称为方向点。连结节点与方向点的是方向线。被激活的节点变成实心点,通过激活节点两边的方向点可以控制曲线的形状。 方向线除了显示方向点到节点距离外,实际上并没有功能。因为方向点确定了,方向线的位置和长度也就是定值。若要移动方向线改变曲线的形状,一定要移动方向点来完成。但是方向线所指的方向就是节点处切线的方向。平滑点和角点示意图连续弯曲的路径,即路径沿着一条连续的波浪形状,是通过称为平滑点的节点来链接的;非连续弯曲的路径是通过角点链接的。 当移动平滑点上的一条方向线时,该点两边的曲线同时调整。相反,当移动角点上的方向线时,只有和方向线一边的曲线进行调整。调整平滑点和角点演示Bezier曲线有许多优点,但是Bezier曲线不能作局部修改,即改变某一个控制点的位置对整条曲线都有影响。 熟悉贝塞尔曲线课后作业 矢量图形除了对几何形状的描述外,还必须对几何图形的颜色、线型、图案、符号、笔宽、图层、叠印关系等进行定义和说明,我们称其为矢量图形的属性参数。绘制图元的属性任何影响图元显示方式的参数属性参数非几何定位参数,例如:颜色、线型和大小等。在绘图软件程序中,常采用的是,为每个输出图元功能扩充相关的属性表来包含合适的属性。例如:直线除了端点坐标外,还包含有颜色、宽度、线型等其他特性的参数。二、矢量图形的属性参数 下面以线条的属性为例说明绘制图元的属性直线段的基本属性有线型、宽度和颜色。(1)线型线型属性包括实线、虚线和点线等。可以通过修改沿线路径的实线段的长度来修改画线的算法,以生成各种类型的线。(2)线宽在光栅实现中,标准线宽是用一个像素的宽度来完成。其他线宽是作为标准线宽的正整数倍通过沿平行线路径画额外的像素来完成。对于斜率绝对值小于1的直线,可修改画线程序,通过在沿线每个X位置画像素的垂直段表示粗线,每段像素的数目等于标准线宽的正整数倍来完成。 (3)笔和笔刷的选择笔和笔刷的选择包括形状、尺寸和样式的选择。实现的方法可以将笔刷的最基本单元(以Illustrator为例)的基本像素组储存在一个像素模版中,在选中此笔刷时,将它设置到线段路径上。(演示)(4)线颜色给输出图元赋予颜色,必须首先将此颜色设置为当前色。则程序以当前色显示激活的图形。 1.颜色印刷色(也称为原色ProcessColor)印刷色指在印刷工艺流程中按常规的分色方法处理颜色。如果某一颜色被设置为印刷色,它在输出时将被分色为原色,分通道处理,直至印刷时才叠印还原。因此在图形输出软件中,所有在打印时被分色为原色处理的4种颜色模型(如CMYK、RGB、HSB和灰度)都称为印刷色。在Illustrator中演示。特别色(又称为专色SpotColor)特别色是一些特殊的预先混合的颜色,在工艺流程中不按常规的分色分通道处理的颜色,用来代替或补充CMYK油墨,它们需要自己的分色。可以将四种颜色模型中的任何一种颜色作为特别色。特别色不一定落在CMYK的色域中,可以是某种不在CMYK色域种的霓虹或金属质感的油墨,也可以是一种在色域中的一定浓淡的颜色。 原色和专色印刷输出时的区别用原色印刷输出使用CMYK成份的颜色。采用CMYK原色色库,用CMYK以不同比例合成各种颜色,这些颜色在进行分色输出时,能够按CMYK分色原理进行分色。原稿黄分色片品红分色片青分色片黑分色片棕蓝绿红品黑1黑2原色输出示意图 蓝、棕、绿、红、紫、黑1(只含黑)、黑2(同时含有CMYK四种颜色),使用原色颜色库中的颜色,分色输出可以分成CMYK四张分色片。也就是说,用原色颜色库设计的要素颜色,在进行图形分色输出时,各颜色按照所含的CMYK比例进行颜色分解,对于混合色来说,将同时在几张片子上表现出来。用专色印刷输出专色印刷输出使用专色颜色库中的颜色,在进行分色输出时,一种专色将得到一张分色片。同样输出7种颜色,当使用专色颜色库中的颜色表示时,经分色输出会得到七张分色片。应该注意的是,专色输出时,采用的是专色分色方法,它不可能用原色分色方法进行分色,这是由软件系统所决定的。 原稿棕分色片蓝分色片绿分色片红分色片紫分色片黑分色片黄分色片品红分色片青分色片专色输出示意图 淡色(Tint)是专色印刷工艺实践中常用术语,指各种专色经过加网颜色变浅的版本,其实质是专色颜色三属性中的彩度和明度发生了变化。加网后的版本相当于用该专色与白色混合,因为网点部位仍然是该专色,而在网点之间是白纸的颜色。淡色印刷可以利用一块专色版印刷出一系列的不同深浅的层次专色印刷中的淡色表示方法淡色 例如,在地图印刷中常利用棕色加不同的网点面积率的网线,得到一系列深浅不同版本的棕,用来表示不同高度的陆地地势。根据需要,专色也可以和专色叠印,加网后的两个系列的专色叠印可以获得的色彩层次更多。对于图形原图也能采用分色(原色印刷工艺流程)的原理复制,但是,使用原色叠印出图形中的细小点和线条是很困难的。细小的图形对象最好选择采用专色印刷工艺流程而对一些专色太多,颜色比较复杂的卡通类或漫画类原稿,可以考虑使用原色印刷的工艺流程 印刷色和专色的概念印刷工艺过程中以原色混色表现的颜色印刷色在印刷前用油墨混色形成所需的颜色后,印刷时直接印刷获得的颜色专色同一种颜色可以是印刷色也可以是专色,输出时就会有差别。利用Illustrator软件演示两者的差别不是颜色本身的区别,而是形成颜色过程的区别(可以说印刷成色的过程不同),前者是分版配色技术,后者是油墨配色技术。例如同样是棕(M50,Y50,C30),印刷色分布在MYC三块版上,M版50%的网点,Y版50%的网点,C版30%的网点,印刷时用原色墨叠印成棕色;专色只出一块版,用M50,Y50,C30配成的油墨印刷成棕色。 颜色在软件中的操作在Illustrator软件中,在色样面板的菜单中选择〔色样选项〕或双击色样面板中的某一个颜色块,可以打开左图的面板,进行颜色的设计和类型(印刷色或专色)的转换等操作。 在色样面板中,凡是右下角有白色三角形的代表是全局色;在白色三角形中有黑点的代表是专色。 计算机专色配色原理与技术专色配色的基本原理是以色彩合成与颜色混合理论为基础,以色料调和方式得到同色异谱色的效果随着电子计算机技术的发展,计算机可以存储大量的数据,具有高速运算能力借助色度学的理论能对大量的油墨基础数据及颜色数值进行处理通过人机对话进行配色,速度快、精度高将其引入印刷领域,可使色彩管理和质量检测更现代化 计算机专色配色具有减少配色时间,降低成本,提高配色效率的特点。能在较短的时间内计算出修正配方可将以往所有配过的油墨颜色存入数据库,需要时可立即调出使用修色配方及色差的计算均由计算机数字显示或打印输出最后的配色结果也以数字形式存入记忆体中操作使用十分简便 专色配色系统可以连接其他功能系统,如可以连接称量系统,将称量误差降到最小;再现性提高,若工艺流程为连续式,可在印品上设置印品质量监视系统,当有任何异常情况发生时,就会立即停机,减少不必要的浪费。、①计算机配色原理二光通理论是由P.Kubelka和F.Munk于1931年提出的,应用得最广泛、最普遍、最成功的光学模型。即通常所说的Kubelka-Munk理论印刷行业应用该理论始于20世纪70年代;美国、日本等国家开发的计算机配色系统,基本上采用这个理论。 吸收系数K散射系数S层厚X基底反射比代表在无限厚的平面介质中,扩散照明光入射后,微元厚度介质层对光的吸收率代表在无限厚的平面介质中,扩散照明光入射后,微元厚度介质层对光的散射率半透明膜层的反射比函数含有四个基本参数Kubelka-Munk方程的基本形式:式中:(双曲余切函数) 通过对K-M理论的一系列推导,给出了适于配色计算的函数最简形式及其导数形式:到目前为止,计算机配色(CCM)的基本原理仍然沿用K-M理论,在计算油墨配方时,可以按光谱反射比曲线直接匹配,也可以按三刺激值匹配。如光谱视觉匹配方法、计算机反射光谱法配色、电脑配色逼近算法等都以K-M理论为基础式中指无穷大厚度时的波长反射率 ②计算机配色系统配色系统的功能计算机配色系统是集测色仪、计算机及配色软件系统于一体的现代化设备。基本作用:将配色所用油墨的颜色数据预先储存在电脑中,然后计算出用这些油墨配得样稿颜色的混合比例,达到预定配方的目的。配色系统的组成配色系统硬件部分软件部分包括分光光度计、计算机、打印机及色谱包含操作系统和测色配色软件 配色系统的选取图形软件中常用的颜色区配系统有PANTONE、TRUMATCH、FOCOLTONE、TOYOColorFinder、ANPA-COLOR、RICColorGuide等TRUMATCH、FOCOLTONE、ANPA-COLOR以印刷四色为基础发展而来的系统其他的则都属于专色的系统PANTONE系统涵盖面较广,既有印刷色的,也有专色的 在PANTONE专色、TOYOColorFinder及RICColorGuide等这些专色颜色匹配系统中,有许多颜色已经超出印刷四色色域,无法用四色油墨表现出来,系统提供的CMYK组合数值也只是近似值。如果选择了专色颜色匹配系统中的颜色,而又以印刷四色分色输出,或者参考了专色在系统中近似显示的相应CMYK组合数值,并使用这些数值用印刷四色替换了原来的专色色彩的失真导致在实际设计配色时,使用哪一个颜色系统由印刷时采用的油墨系统来决定;一般的屏幕很难真实地反映实际印刷效果,所以应选择相应的色彩样本作为输出参考。 PANTONE系统简称PMS,是美国PANTONE公司最初为印刷而设计的配色系统,如今已成为全球油墨行业色彩精确传播和再现的标准色彩语言,包含原色系统、专色系统、转换系统和高保真系统。原色系统:即PANTONEProcessColor系统,按CMYK的油墨百分比定义3000多种颜色,这些颜色都给四色油墨所能产生的色彩以规范即PANTONEFormulaGuide系统,用14种基本油墨配成1114种PMS颜色。对每一个专色,均有符合PANTONE颜色基本色相要求的油墨配方,配方中标有相应的编号及其所配用油墨的百分比。使用时就按照专色的PANTONE编号上标注的油墨百分比进行配置专色系统: 转换系统由于在设计过程中经常使用PANTONE的专色系统来设定颜色,而输出时很多情况下都是转换成四色印刷的,这时就会出现很多颜色不匹配的问题。因此转换系统就在每种专色旁边附上用CMYK四色原色所能生成的最接近的颜色样品,这样可以帮助设计者判定许多很难用或根本不能用CMYK四色方式合成的专色高保真系统该系统是为配合高保真色彩Hi-FiColor而设计的配色系统,是由CMYK四原色加入专色橙及专色绿共6个原色组合产生的颜色系统。这个系统可以达到95%的PANTONE专色效果。 其他颜色系统①DIC颜色系统中的颜色为专色库,共有颜色1280种。②Focoltone为CMYK印刷四色库,有颜色763种。③Mijnsell是一个专色库,颜色种类由用户当前的系统决定。④Toyo为专色库,目前共有颜色1050种。⑤Trynatch为印刷四色库,共有颜色2093种。⑥Grevso为灰色库。 2.线性在Illustrator中线型也称为画笔,用于配置线状要素的形状,通过对路径赋予一定的线型参数,可以将各种艺术效果加入到路径中。它分为四大类型:书法、点状(弥散)、线条和图案画笔。线型要预先制作并存入线型库中,使用时,随时从线型库中提取。书法画笔点状画笔线条画笔图案画笔 3.符号符号用于定义点状要素的图形,存放在预先制作好的符号库中,使用时,从库中提取。软件不同,符号创建方法也不同。Illustrator软件中,“点状画笔”既可以用于定义线条的图案,又可以用于定义点要素的图案。演示 4.图案图案用于为填充区域配置图形,存放在预先制作好的图案库中,使用时,直接从图案库中提取。 5.图层在一个文件中,按照一定的需要或标准把某些相关的要素组合在一起,构成一个图层。一个矢量图形文件可以包含若干个图层,但至少包含一个图层。创建多个图层可以方便地控制打印、组织、显示和编辑图形要素。在每个图层中,对象以堆栈次序堆放,即遵守“后绘者在上”的原则。图层之间遵循“上层压盖下层”的原则,其下层要素是否能够在印刷品上表现出来,取决于上层要素的“叠印”选项设置,参见“叠印与镂空”。 6.叠印与镂空“叠印”又称“透明输出”,当两个要素产生重叠时,将上层要素设为“叠印”,输出后,上下两层的要素都可以完整地表现出来,如左图所示。若不选“叠印”,则输出后,上层要素将压盖下层的要素,此时,称下层要素为镂空状态,也称“非透明输出”,如右图所示。黄色品红色黄版品红版黄色品红色大红色叠印与镂空示意图“叠印”选项设置正确与否,在屏幕上直接看不出结果,只有查看要素的“叠印”选项设置或输出后才能看到。 数字印前图形的创建实例:印前图形软件处理图形的过程可以分为两个阶段:首先利用构建路径的工具,构建图形的路径(路经为创建的待着色的任何线条或形状)。如图3—3所示,在屏幕上构建的同时,图形的形体特征参数就记录在相应的图形文件中。 然后进行路径的着色处理,如图3—4所示,着色处理的过程中,要确定该路径着色的宽度、线型、颜色。利用图形软件的各种菜单命令和面板选择,可以在屏幕上按照事先的设计对路径着色,在屏幕上着色的同时,图形的属性参数也就记录在相应的图形文件中。 第二节数字印前文字处理机理和技术一、文字的属性二、编码技术三、汉字的字库技术 字符是特殊的图形,通常是用编码的方式表示,即在计算机中传输存储的是字符的编码,只有输出时(包括屏幕显示输出和打印输出),才对应生成相应的字符,也就是说输出时必须有与字符编码相对应的一套字库。如果没有这样的一套字库,字符的编码是无法输出相应的字符。文字处理的两个关键技术是编码技术和字库技术 毕升活字方法和计算机文字处理先用胶泥做成一个个规格统一的单字,用火烧硬,使其成为胶泥活字,然后把它们分类放在木格里。=计算机字库技术印刷前的拣字=计算机中处理文字时,实质是处理文字的代码,输出时再根据文字的代码到计算机字库中去调用相应的单字。在计算机中文字是编码的,输出时对应相应的字符,下面分字符的编码技术和字库技术分别介绍。 一、文字的属性字体的大小行距和字距字型字体文字转换路径 字体的大小常用的有点数制和号数制:点(Point)=1/72英寸=0.35mm,一般用字母P表示;号是中国的常用表示方法,点与号的换算如下表,要求了解。点4228.52116141210.5985.25号初号1234小45小567 行距文字段落行与行之间的距离,实际测量的是行的基线到基线之间的距离行距根据需要调节4号字12磅行距 字型和字体一组具有特定外观风格的字符的集合称为文字的类型。如宋体、黑体、魏碑、隶书等。字体大小行距字型字体大小行距字型字体大小行距字型字体大小行距字型字体大小行距字型字体大小行距字型 文字转换成路径在图形软件中能将文字转换成图形,也可以称为文字转换成路径。在激光照排机没有字体(字库)时,可以将文字转换成图形,这样就无需再要打印字体了。将文字转换成图形后可以进行图形的各种变换,此时可以利用直接选择工具对路径上的单个点进行调节。软件演示,文字需用直接选择工具选中才能转换成路径。 二、编码技术计算机只能处理“0”、“1”组合而成的数字,要实现计算机对汉字的存储和管理,就必须用数字去代替汉字。按一定的规则为每个汉字赋予唯一的数字代码、以实现汉字的计算机管理的技术称为汉字的编码技术,或称为汉字的编码标准(规范)。常用的编码技术英文的编码技术ASCII码汉字编码技术国标码GB2312-80国际标准编码机内码国标码与机内码的转换 英文的编码技术ASCII码在英文信息中,以一个字母作为文字处理单位。因此,只要对26个字母逐个地确定代表的数码。国际最流行的字符集是ASCII码,它用8位一个字节表示字符,有只用7位表示128个字符,或8位扩展表示256个字符两种,后者增加了一些特殊字符、外来语以及一些符号。7位ASCII码将一个字节划分成低位4比特表示行和高位3比特表示列,最高位是校验位。在书写的时候行号和列号常用16进制的数字表示,因为16×16=256。 01234560EFASCII编码表示意图7 汉字编码技术对于汉字,一般是以一个整字作为文字信息处理的单位。因此,要对每一个整字确定唯一的代表数码,这样8位编码,256个字符就远远不够了,至少要16位,还有日本,以及很多非英语国家都是如此。国标码GB2312-80常用的汉字编码是国标码-“信息交换用汉字编码字符集基本集”GB2312-80。它是2个字节16位表示的编码,将代码分为94区和94位,任何汉字或符号均用它所在的区和位来惟一确定。如“啊”字,所在是16区,区码为16,从图中可以看到位码是01,所以“啊”字对应的区位码为“1601”;“按”对应的区位码为“1620”。 GB2312的区位编码表(第16区)0 1 2 3 4 5 6 7 8 90啊阿 埃 挨 哎 唉 哀 皑 癌1 蔼 矮 艾 碍 爱 隘 鞍 氨 安 俺2按暗 岸 胺 案 肮 昂 盎 凹 敖3 熬 翱 袄 傲 奥 懊 澳 芭 捌 扒4 叭 吧 笆 八 疤 巴 拔 跋 靶 把5 耙 坝 霸 罢 爸 白 柏 百 摆 佰6 败 拜 稗 斑 班 搬 扳 般 颁 板7 版 扮 拌 伴 瓣 半 办 绊 邦 帮8 梆 榜 膀 绑 棒 磅 蚌 镑 傍 谤9 苞 胞 包 褒 剥 GBK编码GBK编码是中国大陆在GB的基础上制订的扩展的GB中文编码国家标准。GBK于1995年12月完成规范。该编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。国际标准编码随着因特网的使用,统一的国际标准是必须的。UCS(Universalmulti-octetcodedcharacterset)收集了世界上使用的主要语言的绝大部分。国际标准组织于1984年4月成立ISO/IECJTC1/SC2/WG2工作组,针对各国文字、符号进行统一性编码。1991年美国跨国公司成立UnicodeConsortium,并于1991年10月与WG2达成协议,采用同一编码字集。 目前Unicode的V2.0版本于1996公布,内容包含符号6811个,汉字20902个,韩文拼音11172个,造字区6400个,保留20249个,共计65534个。WindowsXP内核支持Unicode,因此所有的语言版本的WindowsXP,都可以显示和识别其他地区的文字。机内码国标码进入计算机内还必须转换成汉字机内码,这是因为国标码是由两个字节的各8位二进制数来表示的,而英文是用一个字节8位(ASCII码)来表示的。由于编码是连排的,为解决计算机中混合使用汉字和英文时需自动识别的问题,引进了汉字内码。 汉字内码必须将ASCII码与汉字编码严格区别,不能产生二义性,并便于计算机内部的处理、查找及字库管理。目前计算机采用的汉字内码绝大部分是“高位为1的两字节码”,即把汉字标准码的两个字节的最高位置为“1”,就得到汉字内码,这样就可以区分是汉字还是英文字符了。对于ASCII码采用7位128个字符,全部英文字母和常用的字符都有了,高位为0;而国标码的高位是1。这样就不会产生混淆的情况。 国标码与机内码的转换有的书上介绍说,将国标码转换成机内码是加上8080H,8080H即二进制的10000000,10000000。输入码(外部)码机内码输出字库国标码(交换码)汉字信息显示字库其他系统代码各种汉字编码之间的关系图 汉字的输入键盘输入法是最常见的文字输入法。通过键盘把输入的每个文字字母、数字、各种符号和文字字符转换成它们所对应的代码,供计算机处理。目前使用的汉字键盘输入法可以分为五类,参见图,其中音码和形码中的五笔字型为最常用的键盘输入法。汉字输入法语音输入光电扫描输入键盘输入对应码:如区位码、电报码、内码等混合方式:如万能五笔音形码:如自然码、二笔输入法等形码:如五笔字型、郑码等音码:如全拼、智能ABC、微软拼音、紫光拼音等 音码输入法以汉字的拼音作为输入依据,这类入法很多,如全拼、双拼、智能ABC、微软拼音、拼音加加、紫光拼音等。不需要特殊记忆,只要会拼音,按拼音的方式击打键盘上的各键,就可以输入汉字,符合人的思维习惯。优点缺点同音字太多,重码率高,输入效率低。对用户的发音要求较高难于处理不认识的生字这类输入方法非常适合普通的电脑操作者,应用非常广泛,但还不能很好地满足专业印前处理人员高效录入文字的需求。 形码输入法以汉字的字形(笔画、部首)作为输入依据。汉字是由许多相对独立的基本部分组成的,例如,“好”字是由“女”和“子”组成,“助”字是由“且”和“力”组成,这里的“女”、“子”、“且”、“力”在形码输入法中称为字根或字元。形码输入法是一种将字根(或字元)对应键盘上的某个单键,再由数个单键组合成汉字的输入方法。最具代表性的形码输入法为五笔字型。每个字按拆分后的字根击打相应的键,即可输入该字。其它形码输入法还有郑码、表形码等。重码少,不受方言干扰,经过一段时间的训练,输入的效率会很高优点需要记忆的东西较多,长时间不用会忘掉缺点 利用汉字的编码技术,可以解决了汉字在计算机中的存储与管理问题,如要存储“啊”字,只需存储它的编码“1601”即可。但是,根据国标码“1601”却无法知道“啊”字的形状,也无法进行该字的显示和输出,这时就需要借助字库技术。在计算机环境下描述每个文字的形状,以实现文字的显示与输出的技术字库技术三、字库技术汉字是特殊的图形。在输出时,每个汉字就是一个图形,显示一个汉字就是显示一个图形符号。这个图形符号就称为字模,字模集就是字库。有的资料上说字库是输出设备的一个组成部分,可以进一步看出字库在印刷输出中的位置。 毕升活字印刷的字库先用胶泥做成一个个规格统一的单字,用火烧硬,使其成为胶泥活字,然后把它们分类放在木格里以备排版之需,这就是毕升的字库。排版时,用一块带框的铁板作底托,上面敷一层用松脂、蜡和纸灰混合制成的药剂,然后把需要的胶泥活字一个个从字库中拣出来,排进框内,排满就成为一版,再用火烤。等药剂稍熔化,用一块平板把字面压平,待药剂冷却凝固后,就成为版型。 数字中文字库的制作过程字稿设计(由专业设计师设计,成本为1/4~1/3)字稿的扫描数字化拟合修字质检整合成库测试商品化 1.点阵字点阵字(位图字)技术是以横向扫描线上点阵的黑或白(以二进制表示时,为1或0)来记录,每一点以一位表示。点阵字是数字字模最早形式。点阵字的缺点:数据量大,放大后会出现明显的锯齿边,这严重地影响了大字的输出质量。 Windows系统中屏幕上的菜单、按钮等处文字使用的是显示字体,它不是以矢量描述的,放大以后会出现锯齿,只适合屏幕描述。不过它的显示速度非常快,所以作为系统字体而在Windows中使用。PS字库中的显示字体也是点阵字体,它仅仅用于屏幕显示,输出时要调用专门的输出字体。 2.矢量字矢量字是轮廓字的一种,这种字符的外轮廓由一系列直线段来描述的,矢量字体中保存的是该字符外轮廓一系列直线坐标,即它所记录的是字符外形轮廓的矢量坐标对,以折线表现字形轮廓。与点阵字相比较,矢量字体的最大优点是数据压缩量大。但大字仍有“刀割”现象 3.曲线字以高次曲线代替矢量字轮廓的一次直线的方程,即为曲线字。曲线字库在放大后仍能保证光滑 两种曲线字PostScript字体(Adobe公司)如AdobeType0、AdobeType1、AdobeType3等,用三次Bezier曲线来描述的。它只能在输出PS文件的打印机上输出。因为它是用PS语言编写的,必须有PS输出驱动器才能转换成输出机器的点阵输出。组成位图字体(屏幕字体)轮廓字体(打印字体)独立 PostScript汉字库分为显示字库和打印字库。挂接在RIP上,在解释页面时由RIP把需要的字库调入页面并解释成记录的点阵。安装在计算机上,用来制作版面时显示用,通常由低分辨率的点阵字构成。当屏幕上显示的字体被发送到打印机时,有四种状况:顺利打印计算机和打印机上都安装了PS字库打印机上没有PS字库计算机中有PS打印字库计算机中的字体下载到打印机上打印 打印机上安装有PS字库计算机上没有PS显示字库用TrueType字体显示显示字体和打样字体有差别如果都没有打印字库用显示字体打印,质量较差转换成图形打印字符一旦转换成了图形,它就和普通的图形一样,不具备文字字体、字形、字号等属性了文件明显变大 ATM(AdobeTypeManager)ATM是Adobe公司提供的字体管理程序。主要用于字体软件的管理和操作。其中有一个功能是解决显示字体屏幕显示的质量问题,其作用是在缺少相应的显示字号时,用其他字号替代放大显示不会出现锯齿现象。例如,没有40号的PS显示字,用20号放大替代。APrinterFontBinary(PFB)filecontainsmathematicaldescriptionsforeachcharacterdesignedforthetypeface.ApplicationsandprintersusePFBfilestoprintfonts,andATMrasterizesthemtodisplaysmoothtexton-screen. ATMsmoothsthedisplayofType1fontsatanypointsizebyrasterizingtheType1font"soutlinefile.Rasterizingistheprocessofconvertingthefontinformationintoascalablebitmapimage.Aftercreatingthescalablebitmapimage,ATMscalestheimagetothesizeyouuse,smoothestheedgesoftheimage,andthendisplaysthesmoothedimage(thatis,thefont)on-screen.IfATMcannotrasterizeaType1outlinefile,textmaynotappearcorrectlyon-screen. CID字库CID格式是美国Adobe公司发表的最新字库格式,它具有易扩充、速度快、兼容性好、简便、灵活等特点,已成为国内开发中文字库的热点。它的描述完全采用Type1字库格式,因此CID字库很容易与大部分的PostScript输出设备兼容,能跨越不同的平台。CID(Characteridentifier)的英文意思是字符识别码,它在组成方式上分成CIDFont,CMap表两部分。CIDFont文件即总字符集包括了一种特定语言中(例如中文)所有常用的字符,把这些字符排序,它们在总字符集中排列的顺序号就是各个字符的CID标识码(Index) CMap(CharacterMap)表即字符映射文件将字符的编码(Code)映射到字符的CID标识码(Index)CID字库完全针对大字符集市场设计,其基本过程为:根据编码Code在CMap表查到标识码Index在CIDFont文件找到相应的字形数据这样改革的主要优点是:易扩充:要在现有的CID字库中加入更多的字符集和编码是很容易的。字库开发者可以先制作一个基本的字符集,以后再加入较多的字数来满足别的市场。这一点对字库开发商来说最有价值。 TrueType字体它是二次B样条曲线描述的字体技术。它是桌面出版系统的两大操作平台——MacOS和Windows的开发商Apple公司和Microsoft公司联合制定的,因而这两种操作系统都内置TrueType的解释器,从系统级上支持TrueType字形技术,任何Windows所支持的输出设备均能用于TrueType字体的输出。UnlikeaType1font,aTrueTypefontconsistsofonlyonefontfile,aTrueTypeFont(TTF)file,usedforbothdisplayandprinting.TrueTypefilesareinstalledintheoperatingsystem"sFontsControlPanelorFontsfolder. 一般情况下TrueType字不能直接由RIP输出。需要经过特殊处理,比如转成曲线或输出时下载,使用起来较麻烦。速度也要慢一些,尤其是处理大量文字时很不方便,不适合用来作为页面的正文文字使用。TrueType字体也用来作为PostScript字库的显示字用,各字库公司同时都有这两种标准的产品。因此当使用TrueType字体制作版面时,输出时仍然可以将它代换成PostScript字库输出。RIP是解释PS语言的栅格器例如:方正世纪RIP可以支持TrueType字体的直接发排,在PSPNT中重置字体时,会有一个“使用系统TrueType字体的选项”,选中这个选项,就可以使用系统中已经安装的TrueType字体了。 TrueType字体优点真正的所见即所得字体。由于True-Type字体支持几乎所有输出设备,因而无论在屏幕、激光打印机、激光照排机上,还是在彩色喷墨打印机上,均能以设备的分辨率输出,因而输出很光滑。支持字体嵌入技术。存盘时可将文件中使用的所有TrueType字体采用嵌入方式一并存入文件之中,使整个文件中所有字体可方便地传递到其它计算机中使用。嵌入技术可保证未安装相应字体的计算机能以原格式使用原字体打印 操作系统的兼容性。MAC和PC机均支持TrueType字体,都可以在同名软件中直接打开应用文件而不需要替换字体。PPT文件嵌入实例1.在软件中选择〔工具/选项〕2.选择〔保存〕面板3.在此面板中选择〔嵌入Truetype字体〕4.再次保存的文件就将Truetype字体嵌入了。结果是在没有此种字体的电脑上也可以显示这种字体了。 TrueType字体不足虽然TrueType既可以作打印字体,又可以用作屏幕显示;由于它是由指令对字形进行描述,因此它与分辨率无关,输出时总是按照打印机的分辨率输出。无论放大或缩小,字符总是光滑的,不会有锯齿出现。但相对PostScript字体来说,其质量要差一些。特别是在文字太小时,就表现得不是很清楚。 方正产品字库厂商与产品:方正、汉仪、蒙纳、安托、华康、华文、创艺 文字信息处理的全过程大致包含以下三个环节:文字信息的输入通过键盘等把各个字符逐个输入:把输入的每个字母、数字或各种符号转换成它们所对应的代码。文字信息的处理对文字信息做相应处理:对文字、句、段的增、删、改、移等操作。对文字串进行分类、合并、排序、检索、对齐等操作。文字信息的输出将处理结果的代码信息转换成文字形式输出,输出方式包括显示和打印。为此,在计算机系统中需要存储有关文字的字形信息。 造字BG2312-80字库:包括汉字6763个,并按汉字的出现频率,将其分成二级,一级汉字3755个,二级汉字3008个。GBK字库:包含汉字20902个GB18030-2000字库:包含汉字27000个。即使这样,仍有一些生僻字在字库中找不到,这些汉字也就无法正常输入,特别是地图出版中,地名中经常会遇到大量的生僻字。因此,必须通过造字的方法来解决。常见的造字方法有:利用Windows自带的造字程序造字利用矢量绘图软件利用专用造字程序造字等 第三节文字和图形的存储格式在数字印前阶段,几乎所有的图形处理软件和排版软件都具备较强的文字处理功能,也可以将处理后的文本存储为软件本身的格式微软的WORD是使用最广泛的以文本编辑排版为主的文本处理软件所以,WORD软件的.doc格式也就成为很多软件都可以接受的文本格式。.txt文本格式也是通用的文本格式,它不携带各种软件排版之后的信息,仅以基本的文字与标点符号记录数据为主所以,几乎所有的软件都可以接受.txt文件 为了区别于纯栅格图像格式,本章的图形格式专指矢量图形格式,即面向对象的描述格式。这一类格式同时具备对栅格图像和矢量图形的描述和存储能力。例如,DXF格式是AutoCAD与其他应用程序交换图形数据时使用的一种面向对象的矢量图形文件格式。这类面向对象的矢量格式在数字印前中使用广泛的有:EPS、PDF、AI格式等。本章仅介绍AI格式。.ai的文件格式是Illustrator软件的文件存储格式,是一种基于PostScript语言的矢量图形文件,也是数字印前中常用的一种页面描述文件格式。与很多图形图像文件一样,AI文件也可以以分图层的方式来组织页面图文,用户可以将不同内容的图文绘制保存在不同的图层中。 与DXF格式相比:AI格式在图文可视化表示方面,如色彩的真实性、图像的高质量表示、图形的线型、光滑等方面远胜于DXF格式在广告、设计、印刷行业中应用广泛.ai文件遵从Adobe的系统文件结构协议,最少包含两部分的主要内容:文件的逻辑结构和运行程序文件的逻辑结构包含了其他程序所需的内容,以对文件进行解释。它还包含了页面所需的PS语言资源,如字体和运算过程的定义等。运行程序则描述了页面中的图形单元,它由与文件的逻辑结构相关的运算符和运行程序组成,同时还有操作对象和数据. 运行程序有三个逻辑单元:一个运行标识,用于启动和激活文件逻辑结构中定义的资源;一个终止符,用来结束或释放资源运行程序存储有一系列的操作符,这些操作符是由文件的逻辑结构中定义的语言编写的一系列图形单元。这些系列单元有数据单元、图形特性参数定义以及对前面定义的运算操作的调用.AdobeIllustratorFileFormatSpecification白皮书中有对AdobeIllustrator文件格式详细的描述一系列的描述操作符'