Webalizer 設定

設定

[root]# cp -v webalizer-2.23-08/sample.conf /usr/local/etc/webalizer.conf

[root]# vim /usr/local/etc/webalizer.conf

    #LogFile  /var/log/httpd/access_log         # ログファイル(apache)
    LogFile  /usr/local/nginx/logs/access.log   # ログファイル(nginx)
    OutputDir    /var/www/html/webalizer  # 解析結果出力ディレクトリ
    Incremental  yes                      # 前回からの差分のみ解析
    HostName     www.kaisekisya.net       # FQDN

    PageType  htm*                        # 解析を行う拡張子
    PageType  cgi
    PageType  php*

    UseHTTPS  yes                         # SSLによる通信も解析

    GeoIP       yes                       # アクセス元 IP から国名取得
    GeoIPDatabase   /usr/local/share/GeoIP/GeoIP.dat.gz

    HTMLPre <!DOCTYPE html>         # HTML5
    HTMLHead <meta charset="utf-8" />  # 文字化け防止

    Quiet           yes                   # 警告とエラー以外出力しない
    ReallyQuiet     no                    # 警告とエラーを出力
    Debug           yes                   # デバックのための情報出力

    AllSites        yes                   # アクセス元を全て表示
    AllURLs         yes                   # URL を全て表示
    AllReferrers    yes                   # リファラーを全て表示
    AllAgents       yes                   # ユーザエージェントを全て表示
    AllSearchStr    yes                   # 検索文字列を全て表示

    HideReferrer example.com/          # 非表示にするリファラー(自ドメイン)
                                             (Hide : 集計結果に含める)

    GroupReferrer   yahoo.co.jp/   Yahoo!Japan   #リファラーをグループ化
    GroupReferrer   google.co.jp/  GoogleJapan
    GroupReferrer   rakuten.co.jp/ InfoSeek(Rakuten)Japan
    GroupReferrer   goo.ne.jp/     Goo
    GroupReferrer   bing.com/      MSNJapan

    GroupAgent Opera/       Opera         # ユーザエージェントをグループ化
    GroupAgent "MSIE 10"    Microsoft Internet Exploder 10
    GroupAgent "MSIE 9"     Microsoft Internet Exploder 9
    GroupAgent "MSIE 8"     Microsoft Internet Exploder 8
    GroupAgent "MSIE 7"     Microsoft Internet Exploder 7
    GroupAgent "MSIE 6"     Microsoft Internet Exploder 6
    GroupAgent "MSIE "      Older Microsoft Exploders
    GroupAgent Firefox/2.   Firefox 2
    GroupAgent Firefox/1.   Firefox 1.x
    GroupAgent Konqueror    Konqueror
    GroupAgent Safari       Safari
    GroupAgent Lynx*        Lynx
    GroupAgent Wget/        WGet
    GroupAgent (compatible; Other Mozilla Compatibles
    GroupAgent Mozilla*     Mozilla/Netscape

    IgnoreSite   localhost                # 無視するアクセス元
    IgnoreSite   192.168.1.*             (Ignore : 集計結果に含めない)

    IgnoreAgent  360Spider                # ロボットを集計結果に含めない
    IgnoreAgent  ADmantX Platform APAC Semantic Analyzer
    IgnoreAgent  ADmantX Platform Semantic Analyzer
    IgnoreAgent  AdvBot
    IgnoreAgent  AhrefsBot
    IgnoreAgent  Baiduspider
    IgnoreAgent  bingbot
    IgnoreAgent  BLEXBot
    IgnoreAgent  CCBot
    IgnoreAgent  crawler
    IgnoreAgent  DotBot
    IgnoreAgent  DuckDuckGo-Favicons-Bot
    IgnoreAgent  ENVCheck
    IgnoreAgent  Ezooms
    IgnoreAgent  Googlebot
    IgnoreAgent  Google favicon
    IgnoreAgent  Googlebot-Mobile
    IgnoreAgent  Google Page Speed Insights
    IgnoreAgent  Google-Publisher-Plugin
    IgnoreAgent  Google Web Preview
    IgnoreAgent  Google Wireless Transcoder
    IgnoreAgent  Mediapartners-Google
    IgnoreAgent  GrapeshotCrawler
    IgnoreAgent  HaosouSpider
    IgnoreAgent  Hatena Antenna
    IgnoreAgent  ia_archiver
    IgnoreAgent  ips-agent
    IgnoreAgent  meanpathbot
    IgnoreAgent  linkdexbot
    IgnoreAgent  Lipperhey
    IgnoreAgent  masscan
    IgnoreAgent  MixrankBot
    IgnoreAgent  MJ12bot
    IgnoreAgent  msnbot
    IgnoreAgent  NetcraftSurveyAgent
    IgnoreAgent  Nutch
    IgnoreAgent  PagesInventory
    IgnoreAgent  proximic
    IgnoreAgent  ResearchBot
    IgnoreAgent  rogerbot
    IgnoreAgent  SemrushBot
    IgnoreAgent  SiteExplorer
    IgnoreAgent  Steeler
    IgnoreAgent  SurveyBot
    IgnoreAgent  XoviBot
    IgnoreAgent  TweetmemeBot
    IgnoreAgent  Twitterbot
    IgnoreAgent  Yahoo! Slurp
    IgnoreAgent  YandexBot
    IgnoreAgent  Y!J-BRJ/YATS

    SearchEngine google.        q=        # 検索文字列
    SearchEngine yahoo.com      p=
    SearchEngine yahoo.co.jp    p=
    SearchEngine goo.ne.jp      MT=
    SearchEngine google.co.jp   q=
    SearchEngine msn.co.jp      q=
    SearchEngine infoseek.co.jp qt=
    SearchEngine fresheye.com   kw=

実行

OutputDir に指定したディレクトリに、結果が出力される。

    [root]# /usr/local/bin/webalizer

自動実行

cron にて、1時間毎に実行。

    [root]# crontab -e

      1 */1 * * * /usr/local/bin/webalizer

ログローテートされている古いログも含めて解析する場合

解析結果出力ディレクトリ内の全てを削除した後で、ログファイルを古い順に指定して、webalizer を実行。

    [root]# /usr/local/bin/webalizer /usr/local/nginx/logs/access.log-20150131
    [root]# /usr/local/bin/webalizer /usr/local/nginx/logs/access.log-20150228
    [root]# /usr/local/bin/webalizer /usr/local/nginx/logs/access.log

解析結果

ブラウザにて、http://localhost/webalizer/