江西广告网

标题: 难道是Google算法泄密 [打印本页]

作者: 犹豫    时间: 2008-12-4 10:07
标题: 难道是Google算法泄密
  7月2号Ruslan Abuzant偶然发现一些看起来像Google服务器状态码的东西,他在看一个网页的Google网页快照时发现这一大堆状态码,当然这个网页快照现在已经看不到了。   这些状态码里面的文字看起来像是Google排名算法中的参数,Matt Cutts7月9号在他的博客里面特意做了回答。他说,Yes, it was real. No, I’m not going to comment on what any of it means. Folks have taken steps to keep it from happening in the future,没错,这些状态码是真的。但是它们是什么意思,我就不能评论了。而且Google的同事们已经采取措施了,不会再让它出现了。   看来这些应该都是非常真实的Google排名算法中的参数,但因为里面的文字很多是简写,也没有任何说明,几乎完全不明白代表的是什么。但有一些词应该可以猜出意思,比如像spamscore(垃圾值)。   有编程经验的人可以研究一下这些状态码,看能看出什么。  pacemaker-alarm-delay-in-ms-overall-sum 2341989 pacemaker-alarm-delay-in-ms-total-count 7776761 cpu-utilization 1.28 cpu-speed 2800000000 timedout-queries_total 14227 num-docinfo_total 10680907 avg-latency-ms_total 3545152552 num-docinfo_total 10680907 num-docinfo-disk_total 2200918 queries_total 1229799558 e_supplemental=150000 –pagerank_cutoff_decrease_per_round=100 –pagerank_cutoff_increase_per_round=500 –parents=12,13,14,15,16,17,18,19,20,21,22,23 –pass_country_to_leaves –phil_max_doc_activation=0.5 –port_base=32311 –production –rewrite_noncompositional_compounds –rpc_resolve_unreachable_servers –scale_prvec4_to_prvec –sections_to_retrieve=body url compactanchors –servlets=ascorer –supplemental_tier_section=body url compactanchors –threaded_logging –nouse_compressed_urls –use_domain_match –nouse_experimental_indyrank –use_experimental_spamscore –use_gwd –use_query_classifier –use_spamscore –using_borg”   上面是什么东西我没看懂,我只看出有cpu的速度和另外一个参数。不过我倒不认为这个是什么算法也不是什么秘密。最近我正在研究搜索引擎的算法。估计搞出来百度Google都通用,但是排名肯定有差距。   本文转载于伊甸园 www.520ydy.cn




欢迎光临 江西广告网 (http://bbs.jxadw.com/) Powered by Discuz! X3.2