2002-2 QC&C Labo 梅木 信治


*** QCテクニック初級講座 *** 
これなら簡単,誰でも使えるSQC”(第8回)

変数間の関連を散布図で見てみよう!
---プロゴルファー獲得賞金とゴルフスコア---

審判の判定が問題になったソルトレイク冬季オリンピックも終わり,いよいよ大リーグや日本プロ野球のオープン戦の時期になりました.プロゴルフトーナメントはアメリカでは既にスタートし,日本では 2002年度のツアーがそろそろ始まります.

   
 今回のトピックスは
散布図(Scatter Diagram)ですが,昨年度(2001年)の日本プロゴルフツアーの記録から幾つかを選び,それらの関連を散布図で描いてみることにより,いろいろな特性間の関連を調べてみました.今回は常識的な関係をスポット的に散布図で表示してみますが,次回は総合的に解析した結果を示したいと思います.
 
 最初に,日本プロゴルフツアーの記録に載っている主な項目(特性)を上の図に示しました.それから,データの一部を下記の表に示しました.これは
平均ストローク数(Scoring average)ベスト20のプレーヤーの諸データです.当然のことですが,平均ストローク数の少ないプレーヤーは獲得賞金額多い傾向にありますが,そうでないケースもあり,何か他の特性が絡んでいるように思われます.また,参考までにコース条件は異なりますが,Tiger Woods のデータを下段に示しましたので日本のトッププレーヤーと較べてみて下さい.この表は右側にあるデータがカットされていますので,全体を見るには,表1をクリックしてご覧下さい.



 なお,獲得賞金額は国内のトーナメントのデータを出場試合数で割った値(MD/G)で比較することにしました.賞金額は皆さんご存知のように,優勝者が最も多く,以下指数関数的に少なくなっていきます.したがって対数変換をして正規分布に近づけてから他の特性との関連を調べることにします.記号は Log(MD/G) としました.それから,データ解析の対象者としては,国内トーナメントの半数以上に出場した120名のプレーヤーとしました.すべてのデータを集めた一覧表も用意してありますので,興味のある方はクリックしてご覧下さい.大きな表(A3サイズで2枚分)なので,Excelファイルのままです.

 先ずゴルフに詳しくない方にも分かっていただけるように,簡単な説明をしましょう.上の図を見ながら読んでいただきたいのですが,最初にティーショットと呼ばれる第1打を打ちますが,一般にはできるだけ遠くへ飛ばします(Driving distance).この時,左右に曲がると第2打が打ちにくくなるので,いわゆるフェアウェイと称する中央部分を狙うのですが,外れることもあります.フェアウェイに止まった率を日本ではフェアウェイキープ率と呼びますが,本場アメリカでは Driving accuracy と呼ぶようです.

 ミドルホールと称するパー4のホールではグリーンを狙って第2打を打ちます.うまくグリーンに乗った確率を日本ではパーオン率と呼びますが,アメリカでは Greens in regulation percentage と呼びます.グリーンに乗れば,後はパターを使ってカップ(ホール)に入れます.普通は2回で入りますが(パー,Par),うまくすれば1回で入るし(バーディ,Birdie),狙いすぎると裏目に出て3回になることもあります(ボギー,Bogey).その時の確率を平均パット数(Putting average)と呼びます.第2打がグリーンに乗らなかった場合は,グリーンの外から第3打を打つことになりますが,これをリカバリーショットと呼び,直接カップインさせるか(Birdie),グリーンに乗せた後で1パットでカップに入ればパーになるので,この時の確率をリカバリー率(Scrambling)と呼びます.

 ゴルフコースにはホールが18あり,10個のミドルホールのほかにショートホールロングホールがそれぞれ4つあります.ミドルホールは打,ショートホールは打,ロングホールは打でカップに入ることをパーと呼び,18ホールを72打でホールアウトすれば,一応平均的なプロのレベルです.トーナメントは4日間行なわれ,合計72ホールのトータルスコアで争われます.ゴルフを知っている方には蛇足になってしまいましたが,用語の英語表現は参考になったことと思います.これらは PGA TOUR のホームページから引用しました.

 今回は散布図とはどういうものか知っていただくために,とりあえず次の4組の散布図を示しました.変数が多くなると相互に関連してくるので,個々の散布図だけを見て関連性を判断するのは見かけに惑わされる場合も出てきますので,総合的に解析する必要があります.このあたりは次回に説明します.
 

Log(Money/G) by Scoring Ave.    Log(Money/G) by Par Breakers
平均ストローク数が低ければ,ランクは上位になるので,当然獲得賞金も多くなる.でも,同じ平均ストローク数でも獲得賞金額には幅があり,それを左右する別の特性があるようだ. バーディやイーグルが増えれば,ストローク数は少なくなるので,賞金額も増える訳だが,何かそれ以上の効果があるみたいだ.このあたりの検討は次回に詳しく行なう.
Par Breakers by Driving Distance Driving Accuracy by Driving Dist
.
飛ばし屋(ロングヒッター)はロングホールでバーディを取りやすいと言われているが,その傾向は確かにある.ただし,バラツキも大きく,決定的な因子とは言い難い. 遠くに飛べば,ちょっとしたブレでも左右に大きくそれる.この散布図ではその傾向が表れているが, Tiger Woods は 300ヤードも飛ばすのに,フェアウェイキープ率は 65%と高い.