基于正则表达式的内文关键字广告投放系统的设计
以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
密 惠 保
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
密 惠 保
资料介绍:
2.2. 本系统的设计原则
2.2.1. 易用性
内文关键字广告系统是作为网站广告营销的一个附加功能,需要网站对在其投放广告的页面进行相应的修改,因此如何使得网站现有内容的改动较少是客户是否接受该广告形式的关键。本系统仅需要站点在其需要投放内文广告的网页中添加一行简单的JavaScript声明就可以实现内文广告投放的全部功能,由于现在大部分站点的页面都具有相对通用的模板,因此只需要将该声明添加到网页模板文件中即可,如果不希望投放内文广告也只需要在模板中移除该声明即可,这些对于现有网站的改动都是简单易行的。
2.2.2. 针对性
较强的针对性是内容关键字广告相比于普通的互联网广告的一个重要优势,页面中的广告词都有与之一一对应的广告内容。这样广告主可以针对某些广告词投放相应的广告,用户也可以针对性的关注某些广告词的广告,因此每个广告的价值都得到充分的发挥。
2.2.3. 通用性
互联网环境错综复杂,大大小小的网站都是由不同的技术来构建的,网站的形式也各式各样,常见的网站形式有门户网站、论坛、博客等。目前市场上也存在着多种浏览器,每种浏览器对WEB标准的支持都各不相同。内文广告的投放要尽量适用不同的网站形式和不同的浏览器。 本文来自think58 [资料来源:THINK58.com]
2.2.4. 高效性
大多数用户浏览网页都是选择性的浏览,停留在一个网页的时间不会很长,这样广告投放的效率就变得非常重要。由于内文广告是基于当前网页内容,所以需要在当前网页内容加载完后才能进行广告投放。因此,本系统需要保证在页面加载完成之后尽快进行广告投放,否则广告的价值将大大降低。
2.2.5. 安全性
由于内文广告是通过提取网页内容中的广告词,并修改网页HTML内容使这些广告词具有投放广告的功能,这样就有破坏原有页面版式和内容的风险。因此,内文广告需要在不破坏原有网页内容和版式的前提下对网页HTML内容进行修改和处理。
2.3.3. HTML/CSS
HTML(Hypertext Markup Language)超文本标记语言是Web的基本描述语言,由Tim Berners-lee提出。设计HTML语言的目的是为能把存放在一台电脑中的文本或图形与另一台电脑中的文本或图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑还是在网络的其他电脑上。这样,你只要使用鼠标在某一文档中点取一个图标,Internet就会马上转到与此图标相关的内容上去,而这些信息可能存放在网络的另一台电脑中。HTML文本是有HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等。HTML的结果包括头部(Head)、主题(Body)两大部分。头部描述浏览器所需的信息,主题包括所要说明的具体内容。 copyright think58 [资料来源:http://THINK58.com]
CSS(Cascading Style Sheets)层叠样式表。目前推荐遵循的是W3C与1998年5月12日推出的CSS2。W3C创建CSS标准的目的是希望以CSS来描述整个页面的布局设计,与HTML所负责的结果分开。使用CSS布局与XHTML所描述的信息结构相结合能帮助设计师分离出表现与内容,使站点的构建及维护更加容易。
本系统各个环节都离不开HTML,需要提交网页的HTML内容,需要生成广告层的HTML,然后修改源页面的HTML。在广告投放过程中本系统使用CSS控制广告层的样式和显示的位置。
2.3.4. Flash
Flash的前身是Future Wave公司开发的FutureSplash Animator,是一个基于矢量的动画制作软件。由于该软件得到良好的反响,于是被Macromedia收归旗下,定名为Macromedia FLASH 2。由于Macromedia的大力宣扬和FLASH 2本身的独特本领,很快成为网络的宠儿。Macromedia Flash作为矢量化的交互式web动画制作工具,它结合macromedia公司的“流”技术--SHOCKWAVE,在web上用于发布交互式的动画。
3.2. 网页内容的提交和分析
内文关键字广告需要基于目标网页内容进行相应的投放,所以必须获得目标网页的内容,然后分析目标网页的内容中含有哪些广告词。通常搜索引擎获取网页的内容都是通过网络爬虫来获取,由于广告投放页面都添加了本系统提供的JavaScript声明,所以广告投放服务器可以返回相应的JavaScript来控制客户端的行为,因此获取网页内容的任务就转移给了客户端,这样网站就不必担心网络带宽被爬虫工具所占用,客户端可以控制只提交其中需要投放广告页面的内容。 think58好,好think58 [资料来源:http://THINK58.com]
3.2.1. 跨域问题
浏览器出于安全的考虑,默认情况下不允许JavaScript进行跨域访问,无法通过JavaScript在*.DomainA.com中把内容提交到*.DomainB.com的服务器上。综合现有的几种跨域解决方法,本系统最终采用Flash Remoting的方式来提交网页内容数据。Flash Remoting与.Net的Remoting不同,.Net可以使用TCP或HTTP协议的传输信道,而Flash Remoting只能使用HTTP协议的传输信道,在Flash Player 5或更早版本的播放器中,跨域或子域访问不受限制,在Flash Player 7播放器中,播放器执行精确域匹配而不是超域匹配规则,即在未经允许的情形下,跨域访问是禁止的。Flash Remoting要实现跨域连接,需要创建一个“crossdomain.xml”的域策略文件,名称必须为“crossdomain.xml”。例如如果DomainB需要通过Flash访问部署在DomainA服务器上的服务,则需要在DomainA的服务器上创建crossdomain.xml的内容如下:
<?xml version="1.0"?>
<cross-domain-policy>
<allow-access-from domain="*.DomainB.com" />
</cross-domain-policy>
用Flash Remoting提交网页内容的局限性在于客户端需要安装Flash插件,由于现在Flash应用已经相当广泛,大部分的客户端浏览器都装有Flash插件,所以该局限性就显得微不足道。本系统通过在返回给客户端的JavaScript中动态输出一个Flash引用使客户端加载相应的Flash文件,然后通过JavaScript获得网页内容并通过该Flash调用部署在服务器端的Web Service生成内容文本文件,之后关键词分析服务将对生成的内容文件进行分析。由于之后的广告投放中需要得到该网页的关键词和所在站点的投放设置,所以客户端提交给服务器的内容中需要包含系统提供给站点JavaScript声明中的站点标识和该网页的URL地址。
2.2.1. 易用性
内文关键字广告系统是作为网站广告营销的一个附加功能,需要网站对在其投放广告的页面进行相应的修改,因此如何使得网站现有内容的改动较少是客户是否接受该广告形式的关键。本系统仅需要站点在其需要投放内文广告的网页中添加一行简单的JavaScript声明就可以实现内文广告投放的全部功能,由于现在大部分站点的页面都具有相对通用的模板,因此只需要将该声明添加到网页模板文件中即可,如果不希望投放内文广告也只需要在模板中移除该声明即可,这些对于现有网站的改动都是简单易行的。
2.2.2. 针对性
较强的针对性是内容关键字广告相比于普通的互联网广告的一个重要优势,页面中的广告词都有与之一一对应的广告内容。这样广告主可以针对某些广告词投放相应的广告,用户也可以针对性的关注某些广告词的广告,因此每个广告的价值都得到充分的发挥。
2.2.3. 通用性
互联网环境错综复杂,大大小小的网站都是由不同的技术来构建的,网站的形式也各式各样,常见的网站形式有门户网站、论坛、博客等。目前市场上也存在着多种浏览器,每种浏览器对WEB标准的支持都各不相同。内文广告的投放要尽量适用不同的网站形式和不同的浏览器。 本文来自think58 [资料来源:THINK58.com]
2.2.4. 高效性
大多数用户浏览网页都是选择性的浏览,停留在一个网页的时间不会很长,这样广告投放的效率就变得非常重要。由于内文广告是基于当前网页内容,所以需要在当前网页内容加载完后才能进行广告投放。因此,本系统需要保证在页面加载完成之后尽快进行广告投放,否则广告的价值将大大降低。
2.2.5. 安全性
由于内文广告是通过提取网页内容中的广告词,并修改网页HTML内容使这些广告词具有投放广告的功能,这样就有破坏原有页面版式和内容的风险。因此,内文广告需要在不破坏原有网页内容和版式的前提下对网页HTML内容进行修改和处理。
2.3.3. HTML/CSS
HTML(Hypertext Markup Language)超文本标记语言是Web的基本描述语言,由Tim Berners-lee提出。设计HTML语言的目的是为能把存放在一台电脑中的文本或图形与另一台电脑中的文本或图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑还是在网络的其他电脑上。这样,你只要使用鼠标在某一文档中点取一个图标,Internet就会马上转到与此图标相关的内容上去,而这些信息可能存放在网络的另一台电脑中。HTML文本是有HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等。HTML的结果包括头部(Head)、主题(Body)两大部分。头部描述浏览器所需的信息,主题包括所要说明的具体内容。 copyright think58 [资料来源:http://THINK58.com]
CSS(Cascading Style Sheets)层叠样式表。目前推荐遵循的是W3C与1998年5月12日推出的CSS2。W3C创建CSS标准的目的是希望以CSS来描述整个页面的布局设计,与HTML所负责的结果分开。使用CSS布局与XHTML所描述的信息结构相结合能帮助设计师分离出表现与内容,使站点的构建及维护更加容易。
本系统各个环节都离不开HTML,需要提交网页的HTML内容,需要生成广告层的HTML,然后修改源页面的HTML。在广告投放过程中本系统使用CSS控制广告层的样式和显示的位置。
2.3.4. Flash
Flash的前身是Future Wave公司开发的FutureSplash Animator,是一个基于矢量的动画制作软件。由于该软件得到良好的反响,于是被Macromedia收归旗下,定名为Macromedia FLASH 2。由于Macromedia的大力宣扬和FLASH 2本身的独特本领,很快成为网络的宠儿。Macromedia Flash作为矢量化的交互式web动画制作工具,它结合macromedia公司的“流”技术--SHOCKWAVE,在web上用于发布交互式的动画。
3.2. 网页内容的提交和分析
内文关键字广告需要基于目标网页内容进行相应的投放,所以必须获得目标网页的内容,然后分析目标网页的内容中含有哪些广告词。通常搜索引擎获取网页的内容都是通过网络爬虫来获取,由于广告投放页面都添加了本系统提供的JavaScript声明,所以广告投放服务器可以返回相应的JavaScript来控制客户端的行为,因此获取网页内容的任务就转移给了客户端,这样网站就不必担心网络带宽被爬虫工具所占用,客户端可以控制只提交其中需要投放广告页面的内容。 think58好,好think58 [资料来源:http://THINK58.com]
3.2.1. 跨域问题
浏览器出于安全的考虑,默认情况下不允许JavaScript进行跨域访问,无法通过JavaScript在*.DomainA.com中把内容提交到*.DomainB.com的服务器上。综合现有的几种跨域解决方法,本系统最终采用Flash Remoting的方式来提交网页内容数据。Flash Remoting与.Net的Remoting不同,.Net可以使用TCP或HTTP协议的传输信道,而Flash Remoting只能使用HTTP协议的传输信道,在Flash Player 5或更早版本的播放器中,跨域或子域访问不受限制,在Flash Player 7播放器中,播放器执行精确域匹配而不是超域匹配规则,即在未经允许的情形下,跨域访问是禁止的。Flash Remoting要实现跨域连接,需要创建一个“crossdomain.xml”的域策略文件,名称必须为“crossdomain.xml”。例如如果DomainB需要通过Flash访问部署在DomainA服务器上的服务,则需要在DomainA的服务器上创建crossdomain.xml的内容如下:
<?xml version="1.0"?>
<cross-domain-policy>
<allow-access-from domain="*.DomainB.com" />
</cross-domain-policy>
用Flash Remoting提交网页内容的局限性在于客户端需要安装Flash插件,由于现在Flash应用已经相当广泛,大部分的客户端浏览器都装有Flash插件,所以该局限性就显得微不足道。本系统通过在返回给客户端的JavaScript中动态输出一个Flash引用使客户端加载相应的Flash文件,然后通过JavaScript获得网页内容并通过该Flash调用部署在服务器端的Web Service生成内容文本文件,之后关键词分析服务将对生成的内容文件进行分析。由于之后的广告投放中需要得到该网页的关键词和所在站点的投放设置,所以客户端提交给服务器的内容中需要包含系统提供给站点JavaScript声明中的站点标识和该网页的URL地址。
think58.com [资料来源:http://www.THINK58.com]