伟大的Web数据捕获辩论:Web日志或JavaScript标签?

海葵在收集Web Clickstream数据时,我们可以使用许多不同的选择。我们可以使用Web日志,Web信标,JavaScript标签和数据包嗅探器。每种方法都具有自己独特的福利和挑战。

[读 这个条目在维基百科 for pro's and con'网日志和javascript标签, 斯蒂芬特博士 那里做得很好。 Auré谎言's post胡安's post 与点击流数据的源头嗅探数据包嗅探。]

但是,如果一个围绕数据捕获的从业者对话的快速脉冲捕获,它变得很快,即最大数量的当前实现(剪切卷)使用Web日志(通常是由于历史)或JavaScript标签(通常是由于最近的演变大多数供应商只是放弃除此之外的所有其他方法)。

二级级别脉冲是人们争论这两种方法中的哪一个是“better”因此应该使用哪一个。有很多关于一种方法或其他方法的讨论。通过一个派对抨击另一方,甚至有更多技术上的令人讨厌的谈话。

缺少的是有人冒着脖子,在选择Web日志或JavaScript标签时要在肢体上出去,以制定一个推荐(假设您已经排除了其他人)。从来没有一个错过机会冒着不必要的风险’LL出去提出建议:

    您应该使用JavaScript标签作为从您网站收集数据时选择的武器。

唯一的假设是你不’T有一个网站,如此惊奇独一无二的网站上没有其他网站上的网站,如你的行星。

以下是挑选一方的四个重要原因(没有伤害 福克斯新闻 我希望它赢了’回来咬我,他们的口号是:我们报告。你决定):

分离数据服务&数据捕获(获得效率和速度):

    使用Web日志数据服务(用户请求时从Web服务器上出现的数据)与数据捕获完全捆绑(当网页移出服务器时,服务器在Web日志文件中记录该信息)。每次想要新的数据都与您的IT组织相关联,可以响应您的IT组织。在大多数公司中,这不是一个快速的响应过程。

    使用JavaScript标签数据捕获与数据服务分开。网页可以从任何地方(从公司Web服务器,来自访问者本地缓存或来自Akamai类型或ISP,Cache Farm),并且您仍将收集数据(页面加载,JavaScript标记执行,数据转到服务器– asp or in-house).

    这一点是,公司IT部门和网站开发人员可以做他们应该做的事情,服务页面和“Analytics department”并执行他们应该做的事情,捕获数据。这也意味着双方在自己的工作中获得灵活性,自私地讲话这意味着分析GALS / GUYS可以独立增强代码(在页面上的标签上并不总是更新,以便更快地收集更多数据。

    依赖它不会下降到0%,它将最终超过25%,但它不是100%,并且在数据捕获和处理方面,它本身就是如此多的选择。

数据类型和大小:

    内置Web日志并存在以收集服务器活动,而不是业务数据。随着时间的推移,我们已经增强了他们收集了越来越多的数据并将其存储在某些方面的理智,以满足商业决策者的需求。它们仍然收集所有技术数据以及业务数据(通常来自支持单个网站的多个Web服务器,每个网站都有一个日志文件,然后需要是“stitched back”提供每个用户的完整视图)。

    开发了JavaScript标签以收集Clickstream数据进行业务分析。在尽可能多的时候,他们更专注于他们所做的事情,并且只收集他们需要的数据(但仍然是允许的所有JavaScript标签都是聪明的,并且他们确实收集了不必要的数据)。这意味着,对于JavaScript标签,您可以每晚捕获,存储和处理量更小的数据(或分钟或数天),并且它可以是一个大量的Saner存在(逻辑上,操作地和战略性)。

革新:

    无论如何,大多数供应商都要远离支持Web日志作为数据来源的产品的支持。许多只提供其产品的JavaScript标签(或数据包嗅探器)版本。历史将决定是否这是一件好事,但实际意义是,在数据捕获的复杂性,报告或分析数据的新方法时发生的大多数创新,都会发生在...... JavaScript数据捕获环境。

    这向我们展示了一个剧烈的选择,必须建立自己的公司,只有自己的公司才能捕获这种新数据并与其他创新保持步伐或依赖于那里的专业知识(无论您喜欢哪个卖方)和保持与所有创新的节奏。

    通常这是一个简单的选择,即考虑其核心竞争力的任何公司,以专注于其业务,而不是开发Web分析解决方案(如果您是沃尔玛,则可能绝对会这样做–例如,他们已经发明了自己的数据库解决方案,因为世界上的任何东西都可以满足他们的大小和规模)。

一体化:

    我们越来越多地朝着在仅单击流中完成更多的测量和客户体验分析。这两个极大的例子是实验和测试(特别是多变量测试)和个性化/行为目标。在两种情况下“add-on”解决方案在网站上被加到网站上,并发生测试/定位。这些解决方案通常是他们自己的收集和分析数据和测量成功的方法。

    但随着我们的综合结束到客户行为的终端视图,为了获得最佳分析,我们必须找到将数据集成到这些附件中的数据,进入标准的Clickstream数据(否则您只为每个附加组件优化不是一件好事)。

    如果使用JavaScript标记,则与这些附加解决方案(通常也使用JavaScript标签和Cookie和Cookie)的组成,如果使用JavaScript标记,则会显着更轻松。在Web日志等中读取cookie很容易,但他可以在其中集成,如果您使用的是使用JavaScript标记,您可以集成的缓解更快。

重要的是要指出,您应该在您独特的需求的背景下考虑您的选择。请仔细阅读每个数据捕获方法的详细专业权和缺点(因为JavaScript标记确实有重要配置’需要仔细考虑的是,Web日志也有他们的好处,包括明显的福利,就像他们找到搜索机器人数据的唯一地方)。

最后,如果您必须在Web日志和JavaScript标签之间做出选择,则需要一些“高级非标准”如果您希望别人为您提供选择,那么您应该思考到2)。

如果你喜欢网络日志,那是什么'问题上面的建议错了吗?如果您通过数据包嗅探发誓,它是否以上面概述的四种方式优于标签?如果可以的话’没有LIVE没有JavaScript标签,上面缺少了什么?如果是困惑,这有助于,请通过评论分享!

[就像这篇文章?有关这样的更多帖子,请 点击这里。]

评论

  1. 1
    史蒂夫 says

    这取决于。将是我的陈述。 :-)

    史蒂夫'第一个分析规则:知道你的观众!

    ;-)

    对于*我*,js几乎是浪费时间和努力。如今我当前用户的50%这样的东西't, won't or don't run JS.
    点击界一切顺利,但如果我'我忽略了50%的用户群我会好玩吗?不。

    旁边:我的理解是,JS页标签是为了解决缓存问题。没有特别点击流程– that's more the result?

    另一个我'常识特别注意到了–可能不等于所有JS / PT;是,如果你弄错了前面,那些收集的数据是有效无用的。我总是在重新审视我的日志–返回2002提取长期趋势信息;报告合作伙伴网站等。
    随着新的想法来到前面,我可以重新申请他们,看看他们如何与我们的想法和现在的方式合作。后古。

    恕我直言,这里的大危险是,一旦你在使用X上将你的思想放在石头上,那么你就会揭露自己以了解你的观众的一部分。这就是为什么我*通过日志分析*我的网站,但仍然运行GA作为交叉检查,验证等。

    顺便提一句。我真的不同意分离"business" vs "server"数据。服务器支持业务。它's *全部*业务数据。详细信息VS概述摘要。两者都有他们非常重要的地方。它(应该!)支持这项业务。如果他们不'T,然后imnsho,他们失败了这项业务。

    数据是数据。它's不是要重要的数据的收集或​​类型。它'你如何使用它。其他一切都是从真正算数的分心。

    最后的想法:不要在黛比@ maxamine ;-)但是任何数据收集方法都需要一个时髦的验证工具是根本破裂的imnsho意见。这里'是一些漂亮的图表,我们'LL使用它们来制作或打破这项业务,但我们没有严谨的可靠性。哎哟。过滤数据是一件事,而不是首先获取数据是别的。

    我的2C,如
    干杯!
    – Steve

  2. 2

    史蒂夫:我真的很难在这个博客上没有回归到平均值。很容易做,特别是随着你的增长和多样性增加。在这种情况下,虽然平均值太强了。 :)

    让我以这种方式回答你的评论:我很幸运能够让你作为我的"web server – data collection – process – and – analysis wiz kid"我会相信你用笔和纸张捕获点击流数据。

    当你告诉我你会用一张纸和笔捕获数据时,我会抛弃所有技术并相信你。我的意思是在所有严重性。

    你非常擅长你做什么和特别有才能。我不是,我怀疑"mean" is not either.

    将这篇文章和建议视为我们其他人的建议! :)

    非常感谢评论和思想。他们总是欢迎他们。

    -avinash。

  3. 3

    伟大的帖子,avinash。一世've始终相信选择比人们的想法要重要得多。 JavaScript标签有优势(例如,避免缓存问题,更容易收集其他变量)和Logfiles的优点(例如,包含搜索引擎机器人活动,缺少供应商锁定),我们可以争辩(或担心)关于它们的争论(或担心)一整天。但最终,一个良好的分析师可以从任何一种技术获得优秀的可操作数据。当您开始分割数据时,它真正处于Web Analytics的核心,那么您'重新比较来自两组游客的相对数字,以及你是否'RE 10%以上或10%以下的10%不可知"true"图似乎不太重要。

  4. 4

    嗨Avinash,像往常一样伟大的阅读:D

    关于您在专业人士中所做的评论's and con'javascript的s和隐含标记实现要求和约束,i'd想指向最近的一篇文章,古德威尔州的CTO,他最近发布在IBL社区网站上。

    简而言之,他描述了如何越来越难以忽视或排除这个Web 2.0年龄的JavaScript。

    基本上,如果你'重新追踪使用JavaScript的用户行为,您可以利用实现来跟踪整体Web流量;)

    这是文章的链接

    干杯,

    朱利安

  5. 5

    但两者的结合呢?
    您如何在不使用日志文件的情况下跟踪下载?

  6. 6

    史蒂夫,

    当大小og你的日志文件将是1个演出日,告诉我如何计算(在有限时间内)从返回到2002的点击流程?

    此外,我的网站结构碰巧随着时间的推移而变化,使单击流数据分析困难。

    我仍然相信世界是由灰色的阴影,而不是黑色或白色。

  7. 7

    SEO门户: 重要的是强调您的独特需求可能意味着不同的解决方案,这完全可以。

    关于组合解决方案,如果有资源和工具使您能够轻松完成这一点'绝对很棒。通常,虽然有限资源(人和$$$),但需要对简化和制作单一选择可能有意义。

    您正在下载(Turner博士也正确地添加了机器人和供应商独立作为日志的好处),它们只会在日志中,尽管有非常有限的数据,您可以从日志文件中下载。许多公司开始使用Akamai下载管理器类型应用程序,在这种情况下,有关可以从那里获得的下载的深度和丰富的信息。 imho你的信息'LL实际上是我们根本可以的商业行动(重复尝试,绑定到用户,中止等)'t从日志文件中获取。

    不是每个公司都将/可以使用下载管理员,在这种情况下,如果下载报告是重要的日志文件是一个好地方。

    特纳博士: 绝对同意您在评论中表达的情绪。那'它。我没有评论! :)

    谢谢,

    arinash。

  8. 8

    我全心全意地同意JavaScript标记进行核心跟踪。但是,JS标记在您可以收集的数据量(例如URL 2083 CHAR限制)中有局限性,并且在许多情况下,您可以从Web Analytics解决方案中创建报告类型。除标准Apache / IIS Web日志之外的另一个替代方案是自定义应用程序日志记录。这里的大缺点是您需要IT资源来构建自定义应用程序日志记录并将其加载到数据仓库中。应用程序日志记录允许我们的公司每名业务活动捕获20-30个不同的变量。我们的JS标记可以'T处理许多变量的组合及其尺寸。应用程序日志记录还允许我们分析搜索引擎爬虫和其他不需要的自动活动,具有精彩的可变深度。我们确实有唯一的标识符,允许我们将我们的JS标记解决方案绑定回我们的应用程序日志记录。我们的JS标记解决方案实际上是我们应用程序日志记录的应用程序日志的子集,但JS标记的增量益处是它提供了我们的UV,推荐人和其他标准的Web度量计数(您从框中开放的所有好东西使用Web分析提供商)。还有一件事,我可以'T告诉您我们在两种跟踪系统之间交叉验证的次数'bugs'在一个或两个系统中的数据捕获中。

  9. 9
    史蒂夫 says

    Sébastien;

    谁说它不是't 1Gb a day? :-)

    我可以谦卑地建议你'以错误的方式接近问题,urm,两次。 :-)
    1GB的百分比与点击流相关?机器人和其他Gumpf的百分比是多少。
    提前过滤两者,您可能会减少1GB至50MB。如果你可以't clickstream that….
    几乎每个专用的映射工具我'曾经看到和/或使用过*真的*有效预热的糟糕工作。
    有股票工具更好。例如,EGREP,Gawk和Perl在预过滤时更有效。使用多CPU机器,使得全部正在研究部分问题。预过滤器阶段也将有助于IO延迟。特别是如果您将日志留下压缩。 IO Latency是一个杀手,用于大量数分析。

    例如。我在HT 3GHz双Xeon IBMX235服务器上进行了所有的分析。我可以在大约一个小时左右的时间里处理一个人的数量的日志。多个阶段过滤,所有4个有效CPU'他们努力工作,磁盘恰好滴答。
    最坏的情况,对多台机器进行过滤,并将其阶段级。简单!
    硬件很便宜– your time is $$$$$.

    另一个技巧–获取可以在内存文件系统中运行的操作系统。例如,在Solaris上的Linux或/ tmp下/ dev / shm。将文件阶段划分为此。因此,您最终会在内存中处理文件。 IO延迟进入Zippo。特别是,如果您构建过滤器链/管道,例如下一个日志在任何需要之前就准备好并等待。

    这让我带来了另一个问题:重新分析不是直接的,通常是日常分析。所以它没有'如果它运行过夜。或更长的。
    我不'Teanalyse每天4年以上数据。也许每年4-8次。我在2006年开始,我很容易加倍两周。

    如果您的结构/布局发生变化,请单击流程甚至值得重新定?它'不再有任何相关。只有在别处的垃圾流分析中,该值并不多。
    所以那部分,恕我直言,无论如何都变得了。

    哦,我同意世界不是黑白的。它's in colour! ;-)

    但是,我的关键信息可能很糟糕,试图贯穿:
    大学教师't忽略任何数据源。交叉检查,验证,重新检查这些假设。它'在这场比赛中,太容易被禁止进入虚假的安全感。

    JavaScript标记,在这里'在哪里我同意阿维什斯,可能对大多数人真正关心他们的网站如何使用的大多数人来说都是足够的。但是当* i *检查我的个人网站时(VS工作's), it'旁边没用。错过了巨大的民间。那个百分比也变化。

    I'd必须问他,它应该相当明显,但我'd betcha I'对于任何非日志分析avinash在此处运行的m不可见。为什么?我跑了这个骗子& adblock plugin'在Firefox中。厌倦了所有JavaScript垃圾,这太多网站扔掉了我的方式。如果一个网站完全休息而没有JavaScript。耸耸肩,其他人唐'T。不是我的损失。很少有人确实是拥有对我关心的内容的网站。

    邪恶的笑容:我知道一个开关javascript标记的一个站点… conversion step you'D称之为。更好地跟踪它。 * Big *网站。每天1GB?如果不多,请​​尝试每半小时。 ;-)
    好吧,他们没有'T真的看着他们的用户如何实际使用该转换步骤,并立即疏远了巨大的客户。大错。他们恢复了更改*很快。
    这是大约4-8个月前从内存。

    托德,
    做一些优秀的积分。在工作中,我实际上使用了大约6个额外的日志系统作为基础Apache日志记录的附件。它变化了。一些捕获应用程序特定的东西,其他搜索引擎(内部)等。
    因为它们都不同,他们协助交叉检查–臭虫狩猎等等。影响是微不足道的。
    纯金Tho,整个系统上的系统得到了不同的看法。然后's the key here. It's不是web服务器,甚至是web服务器场。它'S系统!这就是这样偶然的是提供网页'S原理功能。

    干杯!
    – Steve

  10. 10

    伟大的帖子。在Combo-Solutions上:有几种可用的工具可用于集成页面标签(JavaScript)和日志文件分析。这包含两个世界中最好的,因为您可以设置规则以确定应作为页面视图,点击,退出,印象,文件下载,表单条目(具有从UI抓取的特定信息)来确定应该解释的规则。…可以使用机器人过滤器,可以集成历史记录数据,可以使用缓存破坏,可以实现Web 2.0标签,而且具有不准确的标签(用于让'S Say Say页面名称仍然可以进行评估。

    这些解决方案通常与人员时间或$比下降和GO页标签解决方案更昂贵。

    -有一个

  11. 11

    史蒂夫,

    我同意,使用日志文件时需要过滤。但我们已经从日志中删除了Bot,CSS,XML和图像,以及它'每天仍然是800MB的数据。我不'要说JavaScript比日志数据挖掘更好,我只是说有时候log数据挖掘不值得麻烦。这一切都取决于该网站的目标。

    一个想法日志数据挖掘永远不会被JavaScript标签替换为:Server上的分析负载。但即使这也可以用coradiant等产品替换(www.coradiant.com)

  12. 12

    你好呀,

    您关于WAL-MART构建自己的数据收集解决方案的陈述是正确的或暗示他们使用不正确的Inhouse解决方案。他们确实有自己的数据库,在那里他们还可以组合主要的,次要的砖和马达和网站的三级分析,但他们确实使用第三方供应商进行主要网站数据收集,处理和分析。

    你的陈述:"通常这是一个简单的选择,即考虑其核心竞争力的任何公司,以专注于其业务,而不是开发Web分析解决方案(如果您是沃尔玛,则可能绝对会这样做–例如,他们已经发明了自己的数据库解决方案,因为世界上的任何东西都可以满足他们的大小和规模)。"

    Wal-Mart使用Omniure来跟踪和收集所有属性的数据,包括其Windows Media Player音乐网站。寻找"Omniture"在wal-mart.com上,你会的标签。

  13. 13

    GMAC88:声明是正确的,也许我在提供完整的背景时迟到了。我参考Wal-Mart数据库的魂是关于他们的多张PETABYTE后端,运行所有物流,ERP和商业智能系统(与Web或Web Analytics无关)。

    这一点相当得很好,沃尔玛之一'S核心战略优势是其IT系统和IT系统坐在自定义内置数据库(不是Oracle或Sybase或DB2)的核心本质。我指的是,清楚地来自你的评论,我应该更加广泛。

    谢谢你的评论。

    阿内克斯
    PS:我确实遵循您的指示,并在Walmart.com上搜索Omniture,但这就是我得到的:

    我在开玩笑课程,我知道你说的是什么"search for Omniture"! :)

  14. 14

    除非您正在谈论的标记是真正的基本,否则我不明白标记为什么标记标记分隔数据服务和数据捕获组。数据包嗅探的巨大优势(我更愿意称之为被动数据捕获,因为它不仅仅是捕获数据包的数量)是它真的可以从网站组中分开分离的分析数据收集,并且数据可以用于馈送到许多数据不同的应用程序。被动数据捕获看到DataLink层,因此即使图形由Akamai服务,也可以在页面加载上进行准确的时序,因为页面加载有最终确认。它清理,过滤器并实时地将数据调整,以提供一个干净的日志加载。我们拥有超过100万页PageView,我们每天筛选出所有当地服务的图形,样式表,机器人,本地和远程测试工具等.Akamai提供的许多图形,但用户知道并不知道在分析中需要它。关于本地缓存的论点主要是理论。他们真正关心的页面永远不会缓存,因为它们是安全的购买交易,他们有这么大的统计基础,无论如何都不重要。我们正在寻找营销人员喜欢从标签解决方案中获取的东西的顾客,但它只有基本的东西,他们想要更多。 IT家伙不想做自定义标记。该解决方案是被动数据捕获,可以提供任何日志文件分析包,或者模拟标签服务器以馈送预期数据的包。看 http://www.metronomelabs.com.

  15. 15
    rakhi. says

    我仍然没有得到什么意思'search for omniture' on walmart.com

  16. 16

    avinash,来自您的和解清单。

    //www.dqnk120.com/avinash/2008/11/ultimate-web-analytics-data-reconciliation-checklist.html

    在哪里提到一个问题的问题是人们跑了"JavaScript关闭了(典型2-3%)". I think it'实际上比这更微妙。

    用广告阻止它'S相当容易配置复杂页面负载的哪些部分,而不仅仅关闭显示广告,还可以拒绝加载Google Analytics跟踪JavaScript。所以你的"turned off"读者可能只是默默地旋转,大多数JavaScript工作,但跟踪器消失了。

    由于所有这些代码都在用户中运行's browser, it'没有超越理解,适当动作的人也可以将垃圾扔进数据流,但我没有'看了代码要这样做。

  17. 17

    谢谢你…

  18. 18
    阿卜杜拉 says

    gmac88:walmart使用ominture来跟踪walmart.com
    只要
    不要跟踪他们的数据。
    http://www.omniture.com/press/128

    什么avinash谈到了walmart'S数据生成的日常事务生成。
    沃尔玛不是数据's website

  19. 19

    伟大的帖子,谢谢。我猜这一点"debate" between logs &标签基本上结束,一个确实必须只有非常具体的原因仍然通过日志文件看到。

    虽然,从我所看到的,没有真正的报酬用于日志分析解决方案,我需要这样的事情。从Web服务器日志文件中,我想知道来自下载的404个错误和带宽等内容'我可以用几种mods从awstats获得的东西。

  20. 20

    符合我的无知,但是可以安全地说,网站侧分析工具使用日志文件独家,广告服务器使用JavaScript标记或其他标记技术专门的标记吗?要另一种方式,是用于广告表现的广告系列的页面标记技术,因为它与现场侧转换相关,而日志文件技术用于站点侧订阅,或者进行网站侧分析工具也使用页面标记?

  21. 21

    马特: 庞大的概括但几乎每个Web分析工具,测试工具,调查工具,广告服务工具等现在使用JavaScript收集数据。 JavaScript在页面标记中。

    在某些情况下,日志文件在某些​​情况下是值,如本帖子中所述,还有一些工具仍然支持日志文件解析。

    arinash。

  22. 22
    克雷格 says

    这个话题似乎在3 - 4年后隆隆,这表明了它'仍然没有真正解决。

    在我的思想中,标记基本缺陷(JavaScript可以很容易地关闭;在所有平台上都没有,特别是移动;并且由于标签定位或负载时间和互联网缺陷而往往无法调用。

    日志分析是旧帽子,只显示故事的一半。

    I'一直在看一些新工具,如田田(原子实验室),谁使用数据包嗅探并将数据导出到第三方Web分析工具中。是否有人了解任何做这种事情的人,因为这似乎是唯一的逻辑向前方式(除非您对谷歌风格的高级分析感到满意–javascript很好。如果您需要每次交易,您必须在其他地方看)。

    Mackaycs.

  23. 23

    克雷格: 我担心我必须不同意你的断言,即JavaScript标记是"fundamentally flawed"或者日志分析是"only half the story".

    这两个陈述都是"fundamentally flawed". :)

    pion是一种改进曾经做过的数据包嗅探,它仍然存在与现有标记解决方案组合的标记/日志归档/数据必须克服的局限性,但是一半'生活和资源将朝着创造这一点"perfect"(让我强调引号)系统。

    2010年1月11日在2010年1月11日没有系统,将收集每次(强调您的)交易。悲伤,但绝对真实。

    今天的每个数据收集机制都带来了一组专业版's and a set of con's。我们担任我们公司的花钱的管家的责任是:哪些数据收集系统提供投资和投资回报率的最佳平衡(见解)?在一个不完美的世界。

    答案对于每个公司都会有所不同,每个人都没有毯子正确答案。

    I'如果我也没有补充完美的巨大高估,则会失败。

    -avinash。

    PS:在此处提供数据收集调查'■还有:从Corainiant盒解决方案中的分析: http://goo.gl/AEJL 不需要JavaScript标记。

    PPS:如果您想了解有关Pro的更多信息's and con'关于每个数据收集机制(简短的模糊's)以下是一个可能是值(第一部分)的视频:

    //www.dqnk120.com/avinash/2007/08/web-analytics-vendor-tools-comparison-and-one-challenge.html

  24. 24
    克雷格 says

    谢谢你的回复阿维什什,一些非常公平的积分,我想我略微夸大了标签的死亡;-)

    最终取决于您使用的数据以及网站的复杂性。此外,对于绝大多数JS,毕竟大多数联盟/营销业务已经建立在这种标记的背面,而且它们'一直支付兑现他们的背部。

    夸大的梦想如果您愿意,是为了轻松将事务数据集成到行为,最大限度地灵活地操纵原始数据并进入其他BI系统(也可以尽可能准确);此外,维护和易于实现是考虑的一部分(尽管这也显然是可辩论的,并且如果DEV是外包等,则取决于您的设置)。我知道Unica,Webtrends等也专注于这些地区,并且具有开放系统似乎成为现在的大趋势,这是伟大的。

    谢谢你的链接,肯定会看看这个空间中的各种硬件解决方案。

    我猜我的标准化更多,希望供应商无缝地组合W3C标准日志,JS和任何其他方法(数据包嗅探等),并将一个真相提取到您想要使用该数据的位置?

  25. 25

    像克雷格一样,在我看来,这场辩论没有得到解决。用户的中高到高安全设置的百分比是哪个尺寸的第三组和第一方cookie?

    史蒂夫评论称,“我当前的用户有任何不可取的东西,也不会,不会或不运行js。”

    爱德华vielmetti评论了百分比更高为2-3%。

    是否有任何研究可以提供更明确的百分比百分比的用户't use JS?

  26. 26

    W3C STATS表示,目前大约5%的网络与JS关闭。 (http://www.w3schools.com/browsers/browsers_stats.asp)

    仍然,我'm在Log Server分析软件中看到GA和访问中的访问之间的巨大差异'm使用称为摘要(www.summary.net)。

    I'已经在报告中关闭了已知的机器人,我'm过滤所有图像,多媒体,样式表,XML馈送和js。

    我需要考虑哪些其他因素来协调两种软件之间的访问差异?

  27. 27

    关于你的评论….

    数据胜过直觉。您可以使用Web Analytics工具来测量差异。

    查看我博客的报告的下面的屏幕截图'使用yahoo!测量的javascript状态Web分析:

    JavaScript状态 -  Yahoo! Web Analyics.

    你不'需要相信别人说的,你可以衡量你的网站和你自己的客户。

    比较日志文件和JavaScript驱动数据就像比较苹果和马匹。

    在某些时候,他们有相关(在地球的形成早期:)),但他们在过去几年中刚刚进化了,几乎不可能与这两种方法接近。

    但是,如果您确实想协调数据,那么这里是一个可以使用的指南:

    终极Web分析数据协调核对表

    祝你好运!

    arinash。

  28. 28
    yeshwant. says

    小伙儿,你好's,

    我是新的分析,可以解释我哪种工具支持基于日志和标签的解决方案?我不'T希望使用两种产品进行日志分析和标记。

    • 29

      yeshwant.: 由于许多原因因此,Google Analytics,Sitecatalyst,CoreMetrics等没有日志文件版本。

      您可能仍然可以购买一个版本的Urchin,它将处理日志文件,它将陈旧并包含您的价值的小数'LL从Ga(所以你还是有两个不可调和的工具)。您还可以购买在日志文件上运行的WebTrend版本,当然,它们也有JavaScript版本(再次,不可调和的数据集)。

      除非您有一个非常特定的利基需要(例如提取搜索引擎爬虫行为),否则您可以使用基于JavaScript的解决方案无限更好。而只是一个解决方案。

      -avinash。

追踪

  1. […在圣诞节之后,这可能是最后一次新闻发布。这是今天引起了我的注意。

    1.Avinash Kaushik讨论了在Web日志文件上的JavaScript分析的优点。 […]

  2. […]
    有趣的阅​​读:伟大的Web数据捕获辩论:Web日志或JavaScript标签?
    […]

添加您的观点

*