Solche Kuriosa wie die Rocksaum-Theorie zeigen auch auf, welche Gefahren mit solchen Analysen verbunden sind. Das Data Mining, die systematische Durchforstung großer Datenberge, führt dazu, dass immer mehr Zusammenhänge erkannt werden. Es ist so, als würde jemand einen Heuhaufen minutiös durchwühlen und statt der berühmten Stecknadel gleich ein ganzes Sortiment an Nadeln finden. Das Problem beim Data Mining ist, dass niemand genau sagen kann, ob es sich bei diesem Zusammenhängen um eine wirkliche Ursache handelt oder nur um Scheinkorrelationen, also Zusammenhänge, die sich aufgrund der riesigen Datenmenge rein zufällig ergeben.
Deshalb muss bei der Korrelation eine Erklärung aufgestellt werden, weshalb gerade dieser Faktor einen Einfluss ausübt und als Ursache anerkannt werden kann. Solche Erklärungen sind aber nur Mutmaßungen und Hypothesen, die so lange gelten, bis sie widerlegt sind. Es ist für Anleger gefährlich darauf zu vertrauen, dass es sich um eine wirkliche Ursache handelt, denn im Nachhinein könnte es sich heraussteilen, dass es doch nur ein scheinbarer Zusammenhang war. Bei der Verarbeitungskapazität heutiger Computer können Millionen von Faktoren in die Analyse mit einbezogen werden, so dass die Zahl der Scheinkorrelationen sprunghaft zunimmt. In der Finanzmarktforschung versucht man, die Sicherheit einer solchen Anlagestrategie durch ein hypothetisches Backtesting zu beweisen. Dabei wird ein Zusammenhang, den man durch Data Mining ermittelt hat, über verschiedene Zeiträume hinweg getestet.
Wenn man beispielsweise der Auffassung ist, dass kleine Aktiengesellschaften (Small Caps) langfristig eine bessere Wertent-Wicklung mit sich bringen als die Standardwerte, dann kann diese Annahme belegt werden, indem man sämtliche Aktienkurse in den USA von 1900 bis 2006 untersucht. Das Problem beim Backtesting ist, wie man die Zeiträume wählt. Wenn etwa die Untersuchung aus Kostengründen auf den Zeitraum von 1983 bis 1999 beschränkt wird, erhält man dank dieser herausragenden Boomperiode ein völlig anderes Ergebnis, als wenn man die Untersuchung im Jahr 1928 – kurz vor der entsetzlichen Weltwirtschaftskrise – beginnen lässt. Durch die Variation solcher Zeiträume mussten schon viele gefundene Zusammenhänge aufgegeben werden. da sie sich für einen anderen Zeitraum nicht bestätigten oder sogar als Scheinkorrelation entpuppten.
In den vergangenen Jahren wurde diese Gefahr der Scheinkorrelationen immer deutlicher, als man völlig unsinnige Faktoren miteinander in Verbindung brachte. Jason Zweig führte eine solche Untersuchung durch. Er legte zwei Kriterien fest, die durch ein Data Mining als besonders renditestark ermittelt worden waren Er nahm 25 Prozent aller Aktien in den USA mit der niedrigsten Börsenkapitalisierung. Das zweite Kriterium lautete: Der Name der Aktiengesellschaft durfte keinen Doppelbuchstaben enthalten (also beispielsweise „11“ oder „mm“). Jeder vernünftige Mensch kann sofort erkennen, dass die Schreibweise des Firmennamens keinerlei Einfluss auf die Rendite haben kann. Dennoch erzielte man mit diesen beiden Kriterien innerhalb von 20 Jahren eine jährliche Rendite, die 6 Prozentpunkte über dem Markt- durchschnitt lag. Das Ergebnis beruht aber in Wirklichkeit auf reinem Zufall! Es handelt sich um gar keine Anlagestrategie, die kausal erklärbar wäre.
Für Wissenschaftler und Analysten ist es sehr schwer, echte Zusammenhänge von Scheinkorrelationen zu trennen. Aufgrund der riesigen Datenmengen und der Verarbeitungsmöglichkeiten moderner PCs wird die Zahl solcher Scheinzusammenhänge noch weiter steigen. Fast schon erheiternd ist die Untersuchung, die David Leinweber anstellte. Er verglich die Kursdaten des S&P 500 mit den Statistiken der Vereinten Nationen, um einen Indikator tu finden, der die Wertentwicklung des amerikanischen Börsenbarometers am besten Vorhersagen kann. Das Ergebnis war mehr als amüsant: Die Butterproduktion in Bangladesh korrelierte exakt mit dem Verlauf des Aktienindex S&P 500.
Mindestens ebenso bizarr und unterhaltsam ist die Super-Bowl- Theorie. Wenn Sie Sportfan sind, wissen Sie vielleicht, dass alljährlich in den USA die Meisterschaften im American Football stattfinden. Dieses landesweit übertragene Spitzenereignis, das fast die ganze Nation in den Bann schlägt, kann Vorhersagen über die Entwicklung des Aktienmarktes machen. Im Endspiel der Meisterschaft treten stets zwei Mannschaften gegeneinander an, die konkurrierenden Verbänden angehören. Es gibt die National Football Conference (NFC) und die American Football Conference (AFC).
Der Sportjournalist Leonard Koppett behauptete bereits 1979, dass der Dow-Jones-Index immer dann steigt, wenn eine NFC- Mannschaft gewinnt. Wenn dagegen das AFC-Team im Finale siegt, fällt der Dow-Jones-Index.
Allerdings ist die Zuordnung der Teams etwas kompliziert; denn obwohl die Mannschaften Indianapolis Colts, Pittsburgh Steelers, Baltimore Ravens offiziell dem Verband AFC angehören, zählen sie in der Börsenprognose zum gegnerischen NFC. Der Grund dafür ist, dass sie ursprünglich diesem Verband angegliedert waren und erst später die Verbandszughörigkeit wechselten. Der erste Super Bowl in der Geschichte der USA fand 1967 statt. In 26 von 39 Jahren traf die Prognose ein und die Entwicklung des Dow Jones konnte richtig vorhergesagt werden. Bevor Sie nun schon dem nächsten Super Bowl entgegenfiebern, kann ich Ihnen versichern, dass es sich hierbei um eine Scheinkorrelation handelt.
In einer anderen amüsanten Untersuchung belegten David Hirshleifer und Tyler Shumway, dass die Wertentwicklung eines Aktienmarktes vom Sonnenschein abhängt. Sie analysierten 26 Aktienmärkte für einen Zeitraum von 1982 bis 1997. Als Kriterium für die Sonnenscheinstärke nahm man das Ausmaß der Bewölkung. Sie stellen fest, dass an 18 von 26 Börsen der Sonnenschein eine prominente Rolle spielt, insbesondere an der Börse in Istanbul, Dublin, Santiago de Chile, Singapur und Kuala Lumpur. Sie kamen sogar zu dem Ergebnis, dass man anhand der Wetterprognosen zumindest geringfügige Überrenditen erzielen konnte.
Allerdings sind diese höheren Renditen wenig interessant, da die Transaktionskosten und Steuern aufgrund der ständigen Umschichtung des Depots den Vorteil wieder zunichte machen.
Als Anleger sollten Sie daher solche Anlagestrategien, die einen Überrendite-Effekt versprechen, mit gewissen Vorbehalten befruchten. Auch noch sehr viel später kann sich herausstellen, dass c sich nur um einen scheinbaren Zusammenhang handelt. Ein Backtesting, das die Anlagestrategien anhand unterschiedlicher Zeiträume überprüft, sollte den Zeitraum variieren. Es ist ein gewaltiger Unterschied, ob die untersuchte Periode unmittelbar vor der Weltwirtschaftskrise einsetzt oder vor einer Boomphase beginnt. Auch die Länge der Periode spielt eine Rolle; zu kurze Zeiträume sind viel weniger aussagekräftig. Darüber hinaus kommt es auf den Umschichtungstermin an. Da die meisten Anlagestrategien eine jährliche Umschichtung oder gar eine häufigere Revision vorsehen, kommt dem Umschichtungstermin eine große Bedeutung zu. Wie wir bereits vom Januar- und anderen saisonalen Effekten wissen, hat es enormen Einfluss, ob Sie Ihr Depot am 2 Januar oder im Krisenmonat September in der Zusammensetzung ändern. Anlagestrategien, die mit anderen Umschichtungs- Icrminen durchgerechnet wurden, zeigten plötzlich nur eine geringere oder gar keine Überrendite mehr. In diesem Fall war die höhere Performance auf saisonale Effekte zurückzuführen.