APP下载

保存网页文本有“绝招”

2008-12-29郑小军

中小学信息技术教育 2008年12期

  浏览网页的文本信息时,一般都需要保存为可编辑文本。保存网页文本是中小学教师必须掌握的一项信息技术基本功。通常可以采用直接复制的方法保存网页文本。随着越来越多的网页采样用框架技术或采用JavaScript技术屏蔽鼠标操作(例如拖放、右击)和键盘操作,教师在浏览网页时遇到了无法保存网页文本的难题。笔者总结出保存网页文本的五大实用技巧,为保存网页文本提供了完整的解决方案。
  1.问:保存网页文本最常用的方法是什么?如何去除网页文本中多余的定位表格、底纹、边框和文本格式?
  答:保存网页文本最常用的方法是直接复制保存法。
  当浏览到包含有用文本信息的网页时,第一步是选中文本。可以采用下面三种方法之一来选中要保存的文本:一是按“Ctrl+A”(全选)组合键。这种方法选中文本最快捷,缺点是网页中的其他信息(例如导航栏、定位表格、底纹、边框和文本格式等)也一并选中。如果网页只有文本信息,并且需要全文保存,采用此法最合适。二是用鼠标拖放的方法。这种方法适合选中一屏以内、不太长的连续文本。三是单击文本的起始点(结束点),按住Shift键不放,滚动鼠标,找到文本结束点(起始点)再单击。此法适合选中多屏、比较长的连续文本。第二步是复制选中的文本到剪贴板。执行“编辑/复制”(或按Ctrl+C)操作。第三步是粘贴文本。启动字处理软件(如Word、WPS),将鼠标定位到要插入文本的地方,执行“编辑/粘贴”(或按Ctrl+V)操作。用直接粘贴的办法虽然快,最大的缺点是把网页中的其他信息也一并拷贝,并且要另外删除多余的定位表格、底纹、边框和文本格式,有时操作起来很麻烦。如果只需要保存文本信息,并且不需要重新设置文本格式,最好执行“编辑/选择性粘贴”,选择“无格式文本”,或直接粘贴到记事本中。剪贴板中的网页文本就以纯文本的形式保留下来,便于重新排版。第四步是保存文件。执行“文件/保存”(或按Ctrl+S)操作,将文件保存到合适的位置。
  如果已经将网页文本直接粘贴到Word文档中,并且原始网页已经关闭,但发现有多余的定位表格、底纹、边框和文本格式需要清除,这时首先选中这些文本,再采用以下两种办法快速去除:一是执行“编辑/清除/格式”(或单击格式工具栏的“样式”下拉箭头,选“清除格式”选项)。 二是执行“编辑/选择性粘贴”,选择“无格式文本”选项。
  2.问:当无法用鼠标或键盘选择网页文本时,怎么办?
  答:可将网页另存为纯文本文件。在IE浏览器中执行“文件/另存为”操作,保存类型选“文本文件(*.txt)”。网页中的文字信息将以纯文本的格式保存,而图片、表格、框架、底纹、边框都不会保存下来,超级链接也将无效。
  3.问:想把网页文本保存为网页文件,但IE报告“无法保存网页文件“,怎么处理?
  答:尝试改变文件保存类型。在IE浏览器中执行“文件/另存为”操作,保存类型默认为“网页”。如果不能保存,可选择保存类型为“网页,仅HTML(*.htm,*.html)”或“web文档,单一文件(*.mht)”。再用FrontPage或Dreameweaver等网页编辑软件打开,选中文本拷贝到Word或WPS中。
  4.问:某些框架网页,既不能用鼠标或键盘选择网页文本,又无法另存为文本文件,应该怎么办?
  答:第一步,获取框架网页的URL地址。右击包含有用信息的网页链接,在弹出的“属性”对话框中,用鼠标拖放的方法选中网页地址,右击选中的网页地址,弹出快捷菜单,选择“复制”选项。第二步,单独打开框架网页。回到IE浏览器,删除地址栏中的旧网址,粘贴第一步复制的新网址,按回车键,打开框架网页。第三步,将框架网页另存为纯文本文件。执行“文件/另存为”操作,选择保存类型为“文本文件(*.txt)”。第四步,打开刚刚保存的纯文本文件,删除多余文本,进行必要的编辑处理。此方法的关键是会用右键的方法打开包含网址信息的“属性”对话框,再用鼠标拖动的方法选中网页地址(URL),并且复制网址文本,最后执行“文件/另存为”操作,将网页保存为文本文件(*.txt)。框架网页的特点是当执行“查看/源文件”后,可以看到在记事本中打开的HTML源文件中包含Frame、Frameset、leftFrame、mainFrame等与框架有关的英文单词: ……<frameset rows="*" cols=