[摘要] 博客网流量巨大,存在相当大的商业价值,本文从博客广告投放存在的问题出发,论述了博客网的社会特征、社会网络分析过程,并通过实例说明了博客广告位置选择的一般方法。此方法对博客网广告的发展具有重要意义,由此可以大大提升博客网的盈利能力。
[关键词] 社会网络分析 广告投放 博客
一、博客网存在的问题
博客网是指提供博客产品及服务,并依此赢取商业利益的网站,是Web2.0的主要应用之一。它分为三种类型:综合服务类,如博客网、中国博客网等;门户类,如新浪博客、搜狐博客等;专业服务类,如企业博客网等。综合服务类博客网出现时间最早,服务种类最为齐全,对用户的影响也最大;门户类博客网依托门户网站,品牌知名度较高,盈利压力较小,发展最为迅速;专业服务类博客网由于只专注于某一特殊行业,博客人数相对较少。
据中国互联网络信息中心公布的《2006年中国博客调查报告》显示,截至2006年8月底,中国博主规模已达1750万,其中每月更新一次以上的活跃博主接近770万,注册的所有博客空间数接近3400万,博文读者达7500万,其中活跃的博文读者高达5470万。由此可见,中国博客网人流量巨大,存在商业价值,在用户体验、知识传播、网络营销等方面尤为突出。
虽然博客网影响越来越大,但目前的盈利模式与盈利能力,却与其地位很不相称,与传统的网络应用相比差距很大。究其原因,主要有这几方面:博客的所有权问题得不到很好解决。博客广告投放的位置问题没有得到解决。“名人博客”和“草根博客”的矛盾没有得到解决。
对以上问题进行分析,不难发现,影响博客广告发展的主要因素在于四个方面,分别是:博客广告应投放到什么位置?投放的博客广告内容应是什么?如何投放?投放的收益如何分配?弄清了这四个因素,对博客广告的发展无疑具有重要意义。
四个因素中的关键在于 论文检测天使-免费论文检测软件http://www.jiancetianshi.com
第一个,即寻找合适的博客广告投放位置。注意,这里的合适投放位置不是指名人博客(事实上有时可能是),而是指博客网中的关键结点。寻找到合适的广告投放位置之后,通过分析投放位置处的博客内容,就知道了应该投放的博客广告内容。
论文检测天使-免费论文相似性查重http://www.jiancetianshi.com
二、博客广告择位
1.博客网的社会特征
博客网上聚集了大量的人群,他们撰写各种主题的博文,以发表自己的观点,表达自己的情感等。按博文主题的不同,可以将这些人群分为不同的角色,归属于不同的社交圈。不管属于哪种类型的社交圈,要获得这些信息,都需要对博文内容进行数据挖掘和分析。目前,对博文内容进行数据挖掘的方式主要有以下几种,一是对博文内容进行挖掘,二是对博文结构进行挖掘,三是对博文利用方式进行挖掘。通过对博文内容的挖掘,可以找出博文中有用的信息,如文本、图象、声音、视频等,以便进行资源发现、文档分类与聚合、信息提取等。而博文结构挖掘主要是建立博文与博文间链接的结构模型,以便对网页特别是搜索引擎的结果进行排序,实现类似于Google的PageRank那样的应用。博文利用方式挖掘主要是使用数据挖掘的技术来对一些搜索日志进行挖掘,以便找出有意义的博文阅读模式,以获取博文读者的相关资料。
网络类型,分为三种,分别为随机网络、小世界网络和无刻度的网络。随机网络中,任意两个结点之间,存在连接的概率总是为p,结点具有同源性,没有明显差异,因而不可能形成一个个社交圈;小世界网络,结点差异较大,存在明显的群聚现象;而无刻度网络,大量的结点之间只存在少量的连接,而少数的结点之间却存在大量的连接(这些结点成为了网络中的Hubs结点),网中存在个体差异,也会形成不同的社交圈。
2.社会网络分析与关键结点
社会网络,属于社会科学的一个分支,它以社会成员(人)为结点,以人与人之间的关系为连线,构建网络图,以此为模型来研究人与人、人与社会群体、社会群体与社会群体之间的互动关系和相互影响。社会网络与随机网络有根本的差别。
社会网络分析(SNA),是指通过对社会网络模型中各社会成员(结点)之间关系和相互交往模式的分析,发现对应的社会网络结构。目前,社会网络分析已广泛用于组织行为分析、组织关系分析、人工智能、数据通信与信息安全等方面。当然,社会网络分析也不是万能的,也存在一些缺陷,如只能对静态数据进行分析,对动态数据分析的能力很弱,无法观察因时间因素和结点互动而造成的圈体演化过程,一些重要的影响因子有时也会被遗漏。
在社会网络模型图中,结点的个数总和称为结点大小(Size),结点与结点之间的连结程度成为密度(Density),每个结点所具有的连线称为度(Degree),结点与结点之间的路径长度称为距离(Distance),网络中所有结点之间的最大路径称为网络直径(Diameter)。社会网络分析的目的,最基本的是要找出网络中的一些关键结点,如Hub结点、Betweenness结点、Closeness结点等,如图1所示。在图1中,Andre与Carol结点之间有交互,但与Ike结点之间没有交互,因此Andre与Carol结点之间用一根直线相连,而与Ike结点之间没有用直线相连。社会网络中,存在三种不同类型的关键结点,即三种类型的中心点,分别为Degree Centrality、Betweenness Centrality、Closeness Centrality。Degree Centrality又称Hub结点,是指具有最大度的结点,如Diane结点,它一般是社交圈中的领导或专家,很多成员需要与他进行联系。Betweenness Centrality又称桥接点,是图中关键路径上的点,一般可连接两个不同的社区,如Heather结点,离开它Ike、Jane结点就不能与圈中的其他成员进行交互,它一般是经纪人。Closeness Centrality是指结点与其他结点的距离总和最短,它虽不处于网络的中心位置,但具有网络中的最佳视野,能够观察到网络中的所有流通的信息。
图1 一个社会网络模型
显而易见,对于博客网,若在这三种类型的关键点上投放广告,要比在其他结点上投放广告,所聚合的受众人数要高得多,同时效率也高得多;再结合分析关键点上的博文内容,也就能掌握社交圈的主题,对提高定向广告的精准性有很大好处。
3.博客广告投放位置的选择
博客网具有社会网络的特征,网上存在不同类型的社交圈,通过数据挖掘和社会网络分析,找出博客网不同社交圈中的三种类型的关键点,作为博客广告的最佳投放位。
三、查找关键结点的一般方法
在博客网上查找关键结点的一般方法,分为四个过程,分别为:搜集博文、对博文内容进行提取、网络分析、可视化输出,如图2。
图2 关键结点查找的过程
1.搜集博文
搜集博文的一般方法是利用网络爬行程序,从相关的博客网上搜集并下载所要的博文。
2.信息提取
在获得博文之后,需要对信息进行提取。由于不同的博主可能使用不同的博文摸板,因此信息提取的过程也比较复杂,需要使用一些诸如模式匹配和实体抽取的技术,实际操作时,可根据具体情况进行简化处理。
3.网络分析
网络分析是发布博文定向广告最重要的环节。网络分析主要集中在三个方面:拓扑分析、关键结点分析和群体分析。
拓扑分析的目的主要是验证博客网,在拓扑分析的过程中,使用了几种统计分析指标,如平均最短路径长度、聚合系数、度的分布。平均最短路径长度反映了网络中各个结点之间的总体最短路径,可用来衡量结点间通信的效率;聚合系数表明了网中结点聚合成群体的可能性大小;度的分布概率P(k)能表明一个结点有k个连接的概率大小。
[8]电大学习网.免费论文网[EB/OL]. /d/file/p/2024/0424/fontbr /> 经过拓扑分析之后,接下来就可以利用社会网络分析的方法来分析网络社交圈中的各个关键结点。三种类型的关键结点,Degree Centrality结点的degree最高,其活跃程度也最高,是博客网中的Hub结点,也是博客社交圈中的“领导”或“专家”。Betweenness Centrality结点是桥接点,其值也最高,需要经过它才能访问到其他结点,它是博客社交圈中的“经纪人”。Clossness Centrality值最小,表明其在博客网中的视野最好。
若将社交圈看作是一个结点,大型博客网可能存在由不同规模的社区圈构成的泛社交圈。运用BlockModel技术,也可找出泛社区中的关键结点。
4.可视化输出
网络提取与分析的最终结果,需要通过多维缩放(MDS)或图形化的方式展示给人看。当用图形方式展示时,往往将接近度较高的结点靠近显示,而将接近度较低的结点分离显示。
四、一个实例
新浪博客网是在中国规模较大,较有影响的一家网站。作为研究的实例,利用开源的网络爬行程序:Web-Harvest,从新浪博客上随机选择500篇博文,先按博文的用户名将这些博文归类到136个不同的博主下。为了获知这些博主分别属于哪些社交圈,对所有博文进行社会网络分析。为简化分析的过程,分析之前先将新浪博客的社交圈归结为:几种不同的类型;然后对每一种社交圈,分别设置若干种不同的模式匹配关键词,如对财富金融社交圈设置模式匹配关键词:{行情、港股、美股、新股、权证、大盘、个股、公司、公告、研究、期指}等。
接下来,对每一篇博文进行社会网络分析。生成网络图,每个结点对应一个博主。为了简化分析的过程,不进行网络拓扑分析,只对关键结点进行分析,分析时遵循以下规则:
论文检测天使-免费论文检测软件http://www.jiancetianshi.com
第一,匹配博文内容与社交圈关键词,命中时对应结点的相应社交圈可能值加1。
第二,博文中若出现到某个社交圈或好友的链接,则将此博文对应的结点与圈主或好友结点确定为同一个社交圈结点。
第三,博文中若存在到其他博主的链接,则在对应的两个结点间用线相连。
第四,提取每篇博文中博主的特征信息,如性别、年龄、爱好、职业等。
经过上述过程处理之后,对各结点的若干社交圈可能值进行加权排序,以确定各个结点所在的社交圈,最后用可视化的方法进行输出。
五、结束语
以上通过社会化网络分析,获得的三个比较大的社交圈:情感交流、财富金融、文学艺术,基本上与新浪网所设定的社交圈人气指标相一致,结果令人满意。但由于分析之前,人为设定了S集合的内容,同时由于没有对实例中的网络图进行拓扑分析,网络的非随机性没能得到验证,加上社会网络分析存在的固有缺陷,使得结果的真实性还存在一点点疑问;另外,在关键结点上投放博客广告的效果也有待实践检验。
参考文献:
[1]Anonymous, Web数据挖掘,http://fly-net-cn.javaeye.com/blog/123759,2007.12.8
[2]Gibson,D.,J.Kleinberg,&Raghavan,Inferring Web Communities from Link Topology,Proceedings of the 9th ACM Conference on Hypertext and Hypermedia,1998
[8]电大学习网.免费论文网[EB/OL]. /d/file/p/2024/0424/fontbr />
相关文章:
高校大学生的名牌消费心理探讨04-26
连锁销售企业促销效果研究04-26
我国农产品营销研究述评04-26
关于高校营销管理的几点思考04-26
运输企业应重视加强内部营销04-26
权变市场营销在我国企业营销中的应用04-26
试论企业市场营销能力的模糊评判04-26
浅谈洋快餐企业的服务营销04-26
房地产营销决策支持系统分析与设计04-26
浅析市场营销人才素质的培养04-26