Anzeige. Gutenberg Edition 16. 2. vermehrte und verbesserte Auflage. Alle Werke aus dem Projekt Gutenberg-DE. Mit zusätzlichen E-Books. Eine einmalige Bibliothek. +++ Information und Bestellung in unserem Shop +++
Das seiner Natur nach allgemein gültige Verfahren zur Gewinnung genauer, d. h. numerisch genauer, Einsichten in die innere Struktur von Kausalbeziehungen ist von den experimentellen Naturwissenschaften so vorwiegend angewandt und so vollkommen ausgebildet worden, dass man es in der Regel als etwas ihnen Eigentümliches, als naturwissenschaftliches Verfahren bezeichnet. Es gilt aber, wie gesagt, seiner logischen Natur nach allgemein, für alle Gebiete des Seins und Geschehens; und die Möglichkeit, das tatsächliche Verhalten irgendwelcher Vorgänge genau und exakt zu beschreiben und damit der intuitiven Erfassung ihres Zusammenhanges eine zuverlässige Basis zu geben, hängt überall an der Möglichkeit, dieses Verfahren auf sie anzuwenden.
Worin es besteht, ist bekannt: man sucht den Komplex von Bedingungen, die sich für das Zustandekommen eines gewissen Effekts als maßgebend erwiesen haben, konstant zu erhalten, variiert eine dieser Bedingungen isoliert von den übrigen und in numerisch fixierbarer Weise, und konstatiert dann auf der Seite des Effekts wiederum in einer Messung oder Zählung die begleitende Veränderung.
Einer Übertragung dieses Verfahrens auf die Untersuchung psychischer Kausalbeziehungen im allgemeinen und derjenigen des Gedächtnislebens im besondern scheinen freilich zwei fundamentale und unüberwindliche Schwierigkeiten entgegenzustehen. Wie wollen wir erstens die verwirrende Fülle maßgebender Bedingungen, die, soweit sie geistiger Natur sind, sich unserer Herrschaft so gut wie ganz entziehen und dazu noch unerschöpflich und unablässig sich ändern, wie wollen wir diese auch nur einigermaßen konstant halten? Wie wollen wir es zweitens möglich machen, den psychischen Vorgängen, den zeitlich schnell verfliegenden und begrifflich schwer zu analysierenden, mit einer Zählung beizukommen?
Ich diskutiere zunächst die zweite Schwierigkeit, und zwar in Beziehung zu dem uns beschäftigenden Gedächtnisleben.
Überblickt man noch einmal die oben (§ 2) aufgeführten Bedingungen des Behaltens und Reproduzierens, mit Rücksicht jetzt auf die Möglichkeit einer Zählung, so erkennt man, dass bei zweien derselben eine numerische Fixierung und ebenso eine numerische Variierung wohl möglich ist: die verschiedenen Zeiten, welche verfließen zwischen der ersten Erzeugung und der Reproduktion von Vorstellungsreihen, kann man messen, und die Wiederholungen, welche nötig sind, um die Reihen reproduzierbar zu machen, kann man zählen. Etwas Ähnliches fehlt zunächst auf der Seite der Wirkungen. Hier gibt es nur eine Alternative: eine Reproduktion ist entweder möglich oder sie ist unmöglich; sie geschieht oder bleibt aus. Wir setzen zwar voraus, dass sie unter verschiedenen Umständen dem wirklichen Eintreten auch mehr oder weniger nahe sein könne, dass das eigentliche innere Leben der Reihen also graduelle Verschiedenheiten habe. Allein, solange wir unsere Beobachtungen auf das beschränken, was aus der inneren Welt zufällig, oder auch auf den Ruf unseres Willens, nach außen tritt, sind alle diese inneren Verschiedenheiten für uns in gleicher Weise nicht vorhanden.
Bei etwas geringerer Beschaulichkeit können wir sie indessen auf einem Umwege auch äußerlich hervortreten lassen.
Ein Gedicht werde auswendig gelernt und dann nicht wieder repetiert. Wir wollen annehmen, dass es nach einem halben Jahre vergessen sei: keine Anstrengung des Besinnens vermöge es wieder ins Bewußtsein zurückzurufen, höchstens vereinzelte Bruchstücke kehren wieder. Gesetzt, es werde jetzt aufs neue auswendig gelernt. Dann zeigt sich, dass es, obwohl allem Anschein nach total vergessen, doch noch eine kräftige Wirkung entfaltet. Das Auswendiglernen wird merklich weniger Zeit oder merklich weniger Wiederholungen in Anspruch nehmen, als das erste Mal; oder auch als jetzt nötig sein würden, um ein ähnliches und gleichlanges Gedicht auswendig zu lernen. An der Differenz dieser Zeiten oder Wiederholungen gewinnen wir offenbar ein gewisses Maß für die innere Energie, welche dem das Gedicht ausmachenden geordneten Vorstellungskomplex ein halbes Jahr nach seiner ersten Einprägung noch beiwohnt. Nach einer kürzeren Zeit würde die Differenz vermutlich größer gefunden werden, nach einer längeren geringer; war das erste Auswendiglernen ein sehr sorgfältiges und lange fortgesetztes, so wird sie wiederum größer sein, als wenn es flüchtig geschah und bald abgebrochen wurde.
Kurz, wir haben in diesen Differenzen jedenfalls numerische Ausdrücke für die inneren Verschiedenheiten nachlebender Vorstellungsreihen, die wir sonst zwar voraussetzen müssen, aber durch direkte Beobachtung nicht nachzuweisen vermögen. Damit aber haben wir in ihnen auch etwas, was mindestens dem gleicht, was wir suchen, um eine Handhabe für die Anwendung der naturwissenschaftlichen Methode zu gewinnen: wohl konstatierbare, bei Variierung der Umstände ebenfalls variierende, numerisch fixierbare Erscheinungen auf der Seite der Effekte. Ob wir in ihnen richtige Maßzahlen besitzen für jene inneren Verschiedenheiten, und ob wir dementsprechend durch sie zu richtigen Einsichten in die Kausalverbindungen gelangen, in welche jenes innerlich Lebende eingeht, das läßt sich nicht a priori bestimmen. Ganz ebenso wenig wie die Chemie a priori bestimmen konnte, ob es die elektrischen oder thermischen oder andere Begleiterscheinungen der chemischen Verbindungsvorgänge seien, an denen sie ein richtiges Maß der ins Spiel tretenden Affinitätskräfte habe. Dazu gibt es nur den einen Weg, dass man zusieht, ob man unter Voraussetzung der Richtigkeit zu wohlgeordneten, widerspruchslosen Resultaten und zu richtigen Antizipationen der Zukunft zu gelangen vermag.
Statt des einfachen Geschehens, Eintreten oder Ausbleiben einer Reproduktion, welches keine numerischen Unterschiede zuläßt, will ich also versuchsweise einen zusammengesetzteren Vorgang als den Effekt betrachten, dessen Veränderungen bei Variierung der Umstände ich messend beobachte: nämlich die künstliche Herbeiführung einer nicht von selbst eintretenden Reproduktion durch eine entsprechende Anzahl von ihr entgegenkommenden Wiederholungen.
Allein damit diese Verwertung auch nur versuchsweise möglich sei, müssen jedenfalls noch zwei Bedingungen erfüllt sein.
Es muß einmal möglich sein, den Moment, in dem das Auswendiglernen beendet wird, weil sein Zweck, das Auswendigwissen, als erreicht gilt, mit einiger Sicherheit zu präzisieren. Denn wenn das Auswendiglernen bald länger, bald weniger lange fortgesetzt würde, so würde ein Teil der unter verschiedenen Umständen gefundenen Differenzen auf Rechnung dieser Ungleichheit kommen und mit Unrecht auf innere Verschiedenheiten von Vorstellungsreihen gedeutet werden. Man muß also unter den verschiedenen Reproduktionen, die man bei dem Auswendiglernen z. B. eines Gedichts diesem zu teil werden läßt, eine als besonders charakteristisch bezeichnen und dieselbe zugleich praktisch gut wieder auffinden können.
Man muß zweitens voraussetzen dürfen, dass die Anzahl von Wiederholungen, durch welche unter sonst gleichen Umständen diese charakteristische Reproduktion herbeigeführt wird, allemal dieselbe sei. Denn ist diese Zahl auch unter sonst gleichen Umständen bald so bald anders, so verlieren natürlich die Differenzen, die sich unter verschiedenen Umständen herausstellen, jede Bedeutung für die Beurteilung dieser Verschiedenheiten.
Was nun die erste Bedingung anbetrifft, so ist sie da, wo man von einem Auswendiglernen überhaupt nur sprechen kann, bei Gedichten, Wortreihen, Tonfolgen u. s. w., wohl erfüllbar. Wir sehen hier überall mit zunehmender Zahl der Wiederholungen die Reproduktionen erst stückweise und stockend möglich werden, weiter an Sicherheit zunehmen und schließlich glatt und fehlerlos ablaufen. Man kann offenbar die der Zahl nach erste Reproduktion, bei der dieser letzte Erfolg eintritt, als besonders charakteristische nicht nur bezeichnen, sondern auch praktisch erkennen. Ich bezeichne sie gelegentlich kurz als die erstmögliche Reproduktion.
Es fragt sich also, erfüllt diese die obige zweite Bedingung? ist die Anzahl der zu ihrer Herbeiführung erforderlichen Wiederholungen, unter übrigens gleichen Umständen, allemal dieselbe?
Jedoch in dieser Form wird die Frage mit Recht zurückgewiesen werden, weil sie das eigentlich Fragliche und den wahren Kern der Sache gewissermaßen als selbstverständliche Voraussetzung oktroiere und nun nur eine irreleitende Antwort zulasse. Dass jenes Abhängigkeitsverhältnis bei völliger Gleichheit der Versuchsbedingungen ein konstantes sei, wird man ohne Bedenken zuzugeben bereit sein. Die vielberufene Freiheit der Seele wenigstens ist schwerlich schon von jemandem so mißverstanden worden, dass sie hier Platz griffe. Allein diese theoretische Konstanz ist von geringer Bedeutung; wie soll ich sie finden, wenn die Umstände, unter denen ich tatsächlich zu beobachten gezwungen bin, niemals die gleichen sind? Ich muß also vielmehr fragen: kann ich die unvermeidlich und immer schwankenden Umstände wenigstens soweit in meine Gewalt bekommen und ausgleichen, dass die vermutlich in ihnen waltende Konstanz des in Rede stehenden Abhängigkeitsverhältnisses für mich sichtbar und greifbar wird?
Und so hätte uns denn die Erörterung der einen Schwierigkeit, die sich der exakten Untersuchung von Kausalverhältnissen auf dem psychischen Gebiet entgegenstellt (§ 4), von selbst auf die andere geführt. Eine numerische Fixierung von einander korrespondierenden Änderungen der Ursachen und Wirkungen erscheint uns unter Umständen wohl möglich, wenn wir nur bei den Wiederholungen unserer Versuche die an und für sich schon erforderliche Gleichheit der maßgebenden Bedingungen verwirklichen können.
Wer an die komplizierten Vorgänge des höheren psychischen Lebens denkt oder herkommt von der Beschäftigung mit den noch komplizierteren Erscheinungen des Staats- und Gesellschaftslebens, wird im allgemeinen geneigt sein, die Möglichkeit, behelfs psychologischer Experimente konstante Versuchsumstände herzustellen, zu verneinen. Nichts ist uns geläufiger als die Willkür, das aller Vorsicht und Berechnung Spottende des geistigen Geschehens. Faktoren, die offenbar höchst maßgebende sind und ebenso höchst wandelbare, die geistige Frische, das Interesse an dem Gegenstande, die Anspannung der Aufmerksamkeit, die durch plötzliche Einfälle und Entschlüsse bewirkten Veränderungen des Gedankenlaufs, haben wir gar nicht oder nur in ungenügender Weise in unserer Gewalt.
Indessen man wird sich doch hüten müssen, diesen richtigen Einsichten zu viel Wichtigkeit beizulegen außerhalb der Vorgänge, aus deren Beobachtung sie gewonnen wurden. Alle jene unbotmäßigen Momente sind von der größten Wichtigkeit für die höheren geistigen Vorgänge, die überhaupt nur bei einer besonders günstigen Konkurrenz der Umstände zustande kommen. Die niederen, alltäglichen und ohne Unterlaß geschehenden Prozesse sind ihrem Einfluß keineswegs entzogen, aber wir haben es allerdings meist in unserer Gewalt, da, wo es darauf ankommt, denselben praktisch wenig störend zu machen. Das sinnliche Wahrnehmen z. B. geschieht gewiß mit größerer oder geringerer Genauigkeit je nach dem Grade des Interesses, es wird fortwährend in andere Bahnen gelenkt durch den Wechsel der äußeren Eindrücke und durch innere Einfälle. Aber trotzdem sind wir im allgemeinen ganz befriedigend imstande, ein Haus eben dann zu sehen, wenn wir es sehen wollen und bei zehnmaliger Wiederholung dieser Betrachtung zehnmal hinter einander praktisch dasselbe Bild von ihm zu empfangen, falls keine objektive Veränderung eingetreten ist.
Dass es sich mit dem alltäglichen Behalten und Reproduzieren, welches man doch mit allseitiger Übereinstimmung dem sinnlichen Wahrnehmen zunächst zu rangieren pflegt, ähnlich verhalten solle, hat von vornherein nichts Ungereimtes. Ob es sich aber tatsächlich so verhält oder nicht, das, sage ich wiederum wie vorhin, können wir uns nicht anmaßen a priori entscheiden zu wollen. Unser gegenwärtiges Wissen ist viel zu fragmentarisch, zu allgemein, zu sehr von dem Außergewöhnlichen abstrahiert, als dass wir diese Entscheidung bei ihm suchen könnten; sie muß eigens darauf gerichteten Untersuchungen vorbehalten bleiben. Man muß diejenigen Umstände, deren Einfluß auf das Behalten und Reproduzieren man kennt oder vermutet, versuchsweise einmal so konstant zu halten suchen wie man eben kann, und zusehen, ob das genügt. Das Material wird man so zu wählen haben, dass erhebliche Verschiedenheiten der Anteilnahme ausgeschlossen erscheinen; die Gleichheit der Aufmerksamkeit läßt sich befördern durch Fernhaltung äußerer Störungen; plötzliche Einfälle hat man nicht in der Gewalt, aber im allgemeinen ist ihre störende Wirkung auf Momente beschränkt und wird verhältnismäßig weniger ins Gewicht fallen, wenn man das Experiment zeitlich ausdehnt usf.
Wenn wir aber nun in solcher Weise die uns erreichbare größtmögliche Konstanz der Umstände verwirklicht haben, woran wollen wir erkennen, ob dieselbe für unsere Zwecke praktisch hinreicht? Wann sind die Umstände, die ja doch der schärferen Betrachtung immer noch genug Verschiedenheiten darbieten werden, genügend konstant? Man wird antworten: dann, wenn bei Wiederholung der Untersuchungen die Resultate konstant bleiben. Dies letztere scheint einfach genug zu sein, um sich unmittelbar und von selbst zu erkennen zu geben. Aber der Sache näher tretend stößt man doch auf eine Schwierigkeit.
Wann sollen die unter möglichst gleichen Umständen aus wiederholten Untersuchungen gewonnenen Resultate als konstant oder als genügend konstant gelten? Wenn eines denselben Wert hat wie das andere, oder doch so wenig davon abweicht, dass die Differenz im Verhältnis zu seiner eigenen Größe und zu unseren Zwecken nicht in Betracht kommt?
Offenbar nicht. Das wäre zu viel verlangt und wird auch von den Naturwissenschaften nicht überall geleistet. Also wohl dann, wenn die Durchschnittszahlen aus größeren Gruppen von Versuchen jenes Verhalten zeigen?
Offenbar auch nicht. Das wäre zu wenig verlangt. Denn wenn Beobachtungen von Vorgängen, die nur unter irgend einem Gesichtspunkt eine Ähnlichkeit zeigen, in genügend großer Zahl zusammengeworfen werden, so kommt man fast überall zu leidlich konstanten Durchschnittszahlen, die doch für solche weiteren Zwecke, wie wir sie hier im Auge haben, keine oder nur geringe Bedeutung besitzen. Die genaue Entfernung zweier Signalstangen, die Position eines Sterns zubestimmter Stunde, die Ausdehnung eines Metalls für eine bestimmte Temperaturzunahme, alle die zahlreichen Exponenten, Koeffizienten und sonstigen Konstanten der Physik und Chemie werden uns immer nur gegeben als sehr annähernd konstante Durchschnittswerte aus differierenden Einzelbeobachtungen. Andrerseits sind die Anzahl der Selbstmörder in einem bestimmten Monat, die mittlere Lebensdauer an einem Orte, die Zahl der Wagen und Passanten pro Tag an einer bestimmten Straßenecke u. s. w. ebenfalls je im Durchschnitt aus größeren Gruppen von Beobachtungen merklich konstant. Allein beide Arten von Zahlen, die ich vorübergehend als naturwissenschaftliche und statistische Konstanten bezeichnen will, sind, wie jedermann weiß, konstant aus verschiedenen Gründen und mit ganz verschiedenem Nutzen für die Erkenntnis von Kausalverhältnissen.
Man kann die Unterschiede etwa folgendermaßen formulieren.
Bei der Hervorbringung der naturwissenschaftlichen Konstanten wird jeder einzelne Effekt erzeugt durch eine Kombination von ganz denselben Ursachen. Die Einzelwerte fallen dabei etwas verschieden aus, weil eine gewisse Anzahl jener Ursachen nicht immer mit genau denselben Werten in die Kombination eingeht (kleine Fehler bei der Einstellung und dem Ablesen der Instrumente, Unregelmäßigkeiten in der Textur und Zusammensetzung der untersuchten oder benutzten Körper u. s. w.). Dieses Schwanken einzelner Ursachen jedoch geschieht erfahrungsmäßig nicht absolut regellos, sondern pflegt begrenzte, verhältnismäßig kleine Kreise von Werten symmetrisch um einen Mittelwert zu durchlaufen, oder besser durchzuprobieren. Bei Zusammenfassung mehrerer Fälle müssen sich dadurch die Effekte der
einzelnen Schwankungen mehr und mehr kompensieren zu dem Effekt des mittleren Wertes, um den herum sie stattfinden. Und das schließliche Resultat der Zusammenfassung wird annähernd dasselbe sein, als ob die tatsächlich veränderlichen Ursachen nicht nur begrifflich sondern auch numerisch ganz dieselben geblieben wären. Der Durchschnittswert ist also in diesen Fällen der adäquate zahlenmäßige Repräsentant eines begrifflich bestimmten, wohlumschriebenen Zusammenwirkens; wird ein Glied der Konfiguration variiert, so geben wiederum die begleitenden Veränderungen dieses Durchschnittswertes die richtigen Maße für den Effekt jener Variierungen auf den gesamten Komplex.
Bei den statistischen Konstanten dagegen kann man unter keinem möglichen Gesichtspunkt mehr sagen, dass jeder Einzelwert durch das Zusammenwirken von denselben Ursachen erzeugt worden sei, die teilweise, innerhalb mäßiger Grenzen und im ganzen in symmetrischer Weise schwankende Werte gehabt hätten. Die Einzeleffekte entspringen vielmehr einer oft unentwirrbaren Fülle von ganz verschiedenartigen Ursachenkombinationen, die zwar zahlreiche Momente mit einander teilen mögen, aber im ganzen keine begriffliche Gemeinschaft haben und wesentlich nur in irgend einem Merkmal der Effekte übereinstimmen. Dass die Werte der einzelnen Effekte dabei sehr verschieden werden müssen, ist sozusagen selbstverständlich. Dass nichtsdestoweniger auch hier bei Zusammenfassung großer Gruppen annähernd konstante Zahlen zu Tage treten, bringen wir uns dadurch näher, dass wir sagen, in gleichen und ziemlich großen Zeitstrecken oder Raumgebieten werden die einzelnen Ursachenkombinationen annähernd gleich häufig verwirklicht; ohne dass wir freilich damit mehr tun, als eine eigenartige und wunderbare Veranstaltung der Natur als solche zu konstatieren. Diese konstanten Durchschnittszahlen repräsentieren demnach nicht bestimmte und einzelne Ursachensysteme, sondern Zusammenfassungen von solchen, die ohne weitere Hilfsmittel nicht durchsichtig sind. Ihre Veränderungen bei Variierung der Umstände geben daher auch keine eigentlichen Maßzahlen für die Effekte dieser Variierungen, sondern nur Fingerzeige für dieselben. Sie sind nicht direkt zu verwerten für die Aufstellung numerisch genauer Abhängigkeitsbeziehungen, aber sie arbeiten dieser vor.
Kehren wir hiernach zurück zu der am Anfang dieses Paragraphen gestellten Frage: "wann ist die von uns nach bestem Können versuchsweise verwirklichte Gleichheit der Umstände als genügend zu betrachten?" – so lautet die Antwort: dann, wenn die Durchschnittswerte aus mehreren Beobachtungen annähernd konstant sind, und wenn wir gleichzeitig annehmen können, dass die einzelnen Fälle stets demselben System von Ursachen entsprungen sind, dessen Glieder dabei nur nicht auf durchaus konstante Werte beschränkt waren, sondern kleine Kreise numerischer Möglichkeiten symmetrisch um einen Mittelwert durchlaufen durften.
Indessen abschließend wird durch die eben gefundene Auskunft unsere Frage doch noch nicht beantwortet. Gesetzt, wir hätten für irgend ein psychisches Geschehen auf irgend eine Weise befriedigend konstante Durchschnittszahlen gefunden, wie denken wir nun zu erfahren, ob wir die zu ihrer weiteren Verwertung erforderliche Annahme einer gleichartigen Verursachung machen dürfen oder nicht? Der Physiker weiß im allgemeinen voraus, dass er es mit einer einzigen Ursachenkombination, der Statistiker, dass er es mit einer, trotz aller Zerlegungen immer noch unentwirrbaren Fülle derselben zu tun haben wird; beide aus der gröberen Kenntnis der Vorgänge heraus, die sie bereits besitzen, ehe sie an die feinere Untersuchung herantreten. Wenn uns aber vorhin das gegenwärtige Wissen der Psychologie zu unbestimmt und zu unzuverlässig erschien, um daraufhin über die Möglichkeit der Herstellung konstanter Versuchsbedingungen zu entscheiden, so wird dasselbe jetzt wohl auch nicht zureichen, um befriedigend auszumachen, ob wir es in einer gegebenen Gruppe von Fällen mit einer überall gleichartigen Ursachenkombination zu tun haben oder mit einer zufällig einmal zusammenwirkenden Mehrheit von solchen. Es fragt sich daher, können wir vielleicht noch durch die Hilfe eines sonstigen Kriteriums über die Art der Verursachung der Resultate ins klare kommen, die wir bei der uns möglichen Gleichhaltung der Umstände gewinnen?
Man muß antworten: nicht mit absoluter Sicherheit, aber allerdings mit großer Wahrscheinlichkeit. Ausgehend nämlich von Voraussetzungen, welche denjenigen möglichst nahekommen, die bei der Gewinnung physikalischer Durchschnittszahlen verwirklicht werden, hat man die Konsequenzen untersucht, welche sich aus denselben – ganz unabhängig von der sachlichen Beschaffenheit der Ursachen – lediglich für die Lagerung der differierenden Einzelwerte um den resultierenden Mittelwert ergeben. Wiederholte Vergleiche mit tatsächlich gemachten Beobachtungen haben gezeigt, dass die Ähnlichkeit der Voraussetzungen in der Tat groß genug ist, um zu einer Übereinstimmung der Folgen zu führen: das Resultat jener Spekulationen trifft mit großer Annäherung die Wirklichkeit. Es besteht darin, dass die Gruppierung einer größeren Zahl von Einzelwerten, die durch gleichartige Verursachung unter den mehrbesprochenen Modifikationen zustande gekommen sind, zutreffend beschrieben werden kann durch eine mathematische Formel, das sogenannte Fehlergesetz, welche besonders dadurch charakteristisch ist, dass sie nur eine einzige Unbekannte enthält. Diese Unbekannte mißt die relative Dichtigkeit der Schaarung der Einzelwerte um ihren Mittelwert, sie wechselt demnach mit der Art der Beobachtungen und wird im übrigen aus diesen selbst durch Rechnung bestimmt.
Anmerkung. Für das nähere in Bezug auf diese Formel, auf das es hier nicht ankommt, muß ich auf die Lehrbücher der Wahrscheinlichkeitsrechnung und Fehlertheorie verweisen. Für Leser, welche mit der letzteren nicht vertraut sind, wird eine graphische Erläuterung verständlicher sein als die Mitteilung und Diskussion der Formel. Man denke sich eine bestimmte Beobachtung 1000mal wiederholt. Jede Beobachtung als solche werde repräsentiert durch den Raum eines Quadratmillime-ters, ihr numerischer Wert aber, oder vielmehr ihre Abweichung von dem Mittelwert der sämtlichen 1000 Beobachtungen durch ihre Anordnung längs einer der Horizontallinien p q der nebenstehenden Fig. 1. Für jede Beobachtung, die mit dem Mittelwert gerade übereinstimmt, werde 1 mm auf die Vertikallinie m n gelegt, für jede Beobachtung, die um eine Einheit nach oben abweicht, 1 mm auf eine Vertikallinie rechts von m n, die um 1 mm entfernt ist u. s. w.; für jede Beobachtung, die um x Einheiten nach oben (resp. unten) von dem Mittel abweicht, komme 1 mm auf eine um x mm rechts (resp. links) von m n entfernte Vertikale. Sind alle Beobachtungen in dieser Weise angeordnet, so denke man sich die äußere Kontur der belegten Fläche so weit zusammengedrückt, dass die vorsprin-genden Ecken der einzelnen Quadrate sich in eine gleichmäßig verlaufende Kurve verwandeln. Waren nun die differierenden Einzelwerte so entstanden, dass ihr Mittel betrachtet werden kann als eine Konstante im naturwissenschaftlichen Sinne, so ist die Gestalt der resultierenden Kurve von der Art der in Fig. l mit a und b bezeichneten; ist der Mittelwert eine statistische Konstante, so hat die Kurve irgend eine andersartige Form. (Die Kurven a und b schließen mit den Linien p q gerade je 1000 mm ein. Genau ist das nur bei unendlicher Verlängerung der Kurven und der Linien p q der Fall, aber dieselben nähern sich einander schließlich so sehr, dass da wo die Zeichnung abbricht, für jeden Kurvenzweig nur noch 2—3 mm an der vollen Zahl fehlen.) Ob für eine bestimmte Gruppe von Beobachtungen die Kurve mehr eine steile oder mehr eine flache Form hat, hängt von der Natur dieser Beobachtungen ab. Je genauer sie sind, desto mehr häufen sie sich um den Mittelwert an, desto seltener sind grobe Fehler, desto steiler ist also die Kurve, und umgekehrt. Im übrigen ist das Bildungsge-setz der Kurve allemal dasselbe. Entnimmt man also einem bestimmten Beobachtungskomplex irgend einen Maßstab für die Dichtigkeit der Schaarung der Beobachtungen, so übersieht man die Gruppie-rung der ganzen Maße. Man könnte z. B. angeben, wie oft eine Abweichung von bestimmter Größe vorkommt, oder wie viel Beobachtungen zwischen bestimmten Abweichungen gezählt werden. Oder aber – wie ich im folgenden tun werde – man gibt an, welche Abweichung zwischen sich und dem Mittelwert einen bestimmten Prozentsatz aller Beobachtungen einschließt. Die Linien + w und - w unserer Figur schneiden z. B. aus der ganzen, die Beobachtungen repräsentierenden Fläche gerade die zentrale Hälfte heraus. Aber bei den genaueren Beobachtungen von 1 b sind sie nur halb so weit von m n entfernt, wie bei 1 a. Die Angabe ihrer verhältnismäßigen Entfernung gibt also ebenfalls einen Maßstab für die Sicherheit der Beobachtungen.
Man kann demnach sagen: überall, wo eine Gruppe von Wirkungen betrachtet werden kann als hervorgegangen jedesmal aus derselben Ursachenkombination, die sich allerdings jedesmal nur unter sogenannten zufälligen Störungen verwirklichte, da gruppieren sich diese Werte entsprechend dem Fehlergesetz.
Nun gilt freilich nicht ohne weiteres auch die Umkehrung dieses Satzes, dass nämlich überall, wo eine Gruppierung von Werten gemäß dem Fehlergesetz angetroffen wird, auf jene Art der Verursachung derselben zurückgeschlossen werden darf. Warum sollte die Natur nicht gelegentlich auf kompliziertere Weise eine analoge Gruppierung herbeiführen können? Tatsächlich nur scheint das ein außerordentlich seltenes Vorkommnis zu sein. Denn unter allen den Zahlengruppen, welche die Statistik zu Durchschnittszahlen zusammenzuziehen pflegt, ist bisher nicht eine einzige gefunden worden, welche zweifellos einer Vielheit von Ursachensystemen entstammte und dabei die durch das Fehlergesetz beschriebene Anordnung zeigte 1).
1) Die Zahlen, welche das Vorkommen von Knaben- resp. Mädchengeburten unter je einer größeren Anzahl von Gesamtgeburten angeben, sollen sich sehr genau gemäß dem Fehlergesetz gruppieren. Aber bei diesen wird es ebendarum sehr wahrscheinlich, dass sie einer gleichartigen, auf die Erzeugung eines ganz bestimmten Verhältnisses sozusagen hinzielenden Kombination physiologischer Ursachen entspringen (s. Lexis, Zur Theorie der Massenerscheinungen in der menschlichen Gesellschaft u. a. S. 64).
Man wird sich daher dieses Gesetzes, wenn nicht als eines unbedingt sicheren, so doch als eines mit großer Wahrscheinlichkeit orientierenden Kriteriums bedienen können, um zu erkennen, ob die annähernd konstanten Mittelwerte, die man durch irgend ein Verfahren erhält, als wahre naturwissenschaftliche Konstanten versuchsweise weiter verwertet werden dürfen oder nicht. Dasselbe gibt nicht die hinreichenden, aber eine der notwendigen Bedingungen für diese Verwertbarkeit, und die endliche Aufklärung muß man von dem Fortgange eben der Untersuchungen erwarten, denen es eine gewisse Sicherheit der Unterlage geben hilft. Den von ihm gebotenen Maßstab habe ich daher auch zur Beantwortung unserer immer noch schwebenden Frage angelegt: ist die durchschnittliche Anzahl von Wiederholungen, die erforderlich sind, um unter möglichst gleichen Umständen gleichartige Reihen bis zur "erstmöglichen" Reproduktion zu lernen, eine konstante Durchschnittszahl im naturwissenschaftlichen Sinne? Und wie ich gleich vorwegnehmend bemerke, ist die Antwort hierauf in den untersuchten Fällen bejahend ausgefallen.
Gegen die Übertragung der sogenannten naturwissenschaftlichen Methode auf die Untersuchung psychischer Vorgänge erheben sich zwei, wie es scheint, fundamentale Schwierigkeiten: 1) der stete Fluß und die Unbotmäßigkeit des psychischen Geschehens erlauben nicht die Herstellung konstanter Versuchsbedingungen; 2) die psychischen Vorgänge bieten keine direkte Handhabe für eine Messung oder Zählung.
Für das spezielle Gebiet des Gedächtnislebens (Lernen, Behalten, Reproduzieren) läßt sich die zweite Schwierigkeit einigermaßen überwinden. Unter den äußeren Bedingungen dieser Vorgänge sind einige der Messung direkt zugänglich (Zeit, Zahl der Wiederholungen). Dieselben lassen sich verwerten, um auch da indirekt ein numerisches Element zu gewinnen, wo dies direkt nicht mehr möglich ist. Man muß nicht abwarten, bis die dem Gedächtnis anvertrauten Vorstellungsreihen von selbst wieder ins Bewußtsein treten, sondern man muß ihnen entgegenkommen und sie so weit auffrischen, bis sie gerade fehlerlos reproduziert werden können. Die dazu unter bestimmten Umständen erforderliche Arbeit betrachte ich versuchsweise als ein Maß für den Einfluß dieser Umstände; die bei Abänderung der Umstände hervortretenden Arbeitsdifferenzen als Maße für den Einfluß eben jener Abänderungen.
Ob sich auch die erste Schwierigkeit, die der Herstellung konstanter Versuchsumstände, befriedigend überwinden lasse, kann a priori nicht entschieden werden. Man muß einmal Versuche unter möglichst gleichen Umständen anstellen und zusehen, ob die, im einzelnen voraussichtlich immer von einander abweichenden Resultate bei Zusammenfassung größerer Gruppen konstante Durchschnittswerte liefern. Indes an und für sich ist das noch nicht hinreichend, um die gefundenen Zahlen zur Aufstellung numerischer Abhängigkeitsbeziehungen im naturwissenschaftlichen Sinne zu verwerten. Die Statistik operiert mit einer großen Menge konstanter Durchschnittszahlen, die gar nicht der häufigen Wiederholung eines begrifflich gleichartigen Geschehens entspringen und also auch nicht zu weiteren Einsichten in ein solches verhelfen können. Bei der großen Kompliziertheit des psychischen Lebens läßt sich die Möglichkeit nicht abweisen, dass etwa gefundene konstante Mittelwerte von der Art solcher statistischen Konstanten sind. Um darüber zu orientieren, untersuche ich die Gruppierung der einzelnen, zu einem Durchschnittswert zusammengefaßten Zahlen. Entspricht dieselbe derjenigen Verteilung, die in den Naturwissenschaften überall gefunden wird, wo die wiederholte Beobachtung eines gleichartigen Geschehens differierende Einzelwerte gibt, so nehme ich – wiederum versuchsweise – an, dass auch der betreffende wiederholt untersuchte psychische Vorgang allemal unter genügend gleichen Umständen für unsere Zwecke vonstatten gegangen sei. Zwingend ist diese Annahme nicht, aber sehr wahrscheinlich. Ist sie falsch, so wird der Fortgang der Untersuchungen dies voraussichtlich von selbst lehren: die von verschiedenen Gesichtspunkten gestellten Fragen werden zu widersprechenden Resultaten führen.
Die Größe, welche die Dichtigkeit der gewonnenen Beobachtungen mißt und die ihre Verteilung darstellende Formel für jeden Fall zu einer bestimmten macht, kann man, wie schon erwähnt, verschieden wählen. Ich benutze den sogenannten "wahrscheinlichen Fehler" (w), d. h. diejenige Abweichung von dem Mittelwert nach oben und nach unten, welche von den Einzelwerten ebenso oft überschritten wie nicht erreicht wird, welche also zwischen ihrem positiven und negativen Betrag gerade die Hälfte aller Beobachtungsresultate, symmetrisch um den Mittelwert gelagert, einschließt. Man kann sie, wie aus ihrem Begriff ersichtlich, aus diesen Resultaten durch einfaches Abzählen herausfinden, genauer geschieht dies durch eine theoretisch begründete Berechnung.
Hat man nun für irgend eine Gruppe von Beobachtungswerten diese Berechnung versuchsweise angestellt, dann erkennt man eine dem Fehlergesetz entsprechende Gruppierung jener Werte daran, dass innerhalb der Teile und Multipla des versuchsweise berechneten wahrscheinlichen Fehlers annähernd so viel Einzelwerte in symmetrischer Verteilung um den Mittelwert gezählt werden, wie die Theorie jenes Gesetzes verlangt.
Nach dieser sollen beispielweise fallen von je 1000 Beobachtungen:
innerhalb der Grenzen | Anzahl der Einzelwerte |
±1/10 w | 54 |
± 1/6 w | 89,5 |
± 1/4 w | 134 |
± 1/2 w | 264 |
± w | 500 |
± 11/2 w | 688 |
± 2 w | 823 |
± 21/2 w | 908 |
± 3 w | 957 |
± 4 w | 993 |
Besteht diese Übereinstimmung in genügender Weise, dann reicht die einzige Angabe des wahrscheinlichen Fehlers hin, um die Lagerung sämtlicher Beobachtungen zu charakterisieren, und gleichzeitig gibt seine Größe einen brauchbaren Maßstab für die Dichtigkeit ihrer Schaarung um den Mittelwert, d. h. für ihre Genauigkeit und Vertrauenswürdigkeit.
Und wie in solcher Weise von einem wahrscheinlichen Fehler der einzelnen Beobachtungen (wb), so kann man auch sprechen von einem wahrscheinlichen Fehler der Mittelwerte (wm). Derselbe beschreibt ganz entsprechend die Gruppierung, welche sich für verschiedene Mittelwerte herausstellen würde, wenn man die Beobachtung desselben Phänomens noch sehr oft wiederholte und jedesmal ebenso viele Beobachtungen wie gegenwärtig zu einem Mittelwert zusammenfaßte; er gibt eine kurze aber zureichende Charakteristik der Schwankungen der aus Wiederholung der Beobachtungen resultierenden Mittelwerte und damit ebenfalls ein Maß für die Sicherheit und Vertrauenswürdigkeit des gegenwärtig gefundenen. Er ist daher im folgenden überall beigefügt worden. Wie er berechnet wird, kann wiederum hier nicht auseinandergesetzt werden, wenn nur klar ist, was er bedeutet. Er sagt also, dass man auf Grund des Charakters der sämtlichen Beobachtungen, aus denen man gegenwärtig einen Mittelwert gewonnen hat, mit der Wahrscheinlichkeit l zu l hoffen darf, dieser Wert weiche höchstens um die Breite seines wahrscheinlichen Fehlers von demjenigen Mittelwert ab, der aus unendlich oft wiederholten Beobachtungen als der präsumtiv richtige resultieren würde. Eine größere Abweichung fängt gerade an, unwahrscheinlich im mathematischen Sinne zu werden, d. h. eine größere Wahrscheinlichkeit gegen sich als für sich zu haben. Und, wie ein Blick auf die eben mitgeteilte Tabelle lehrt, wächst die Unwahrscheinlichkeit größerer Abweichungen außerordentlich schnell mit zunehmender Größe der letzteren. Dafür z. B., dass die Abweichung des gefundenen Mittelwertes von dem präsumtiv richtigen die 2½fache Breite des gleichzeitig gefundenen wahrscheinlichen Fehlers übersteige, besteht nur die Wahrscheinlichkeit 92 : 908, also etwa 1 : 10, für Überschreitung der vierfachen Breite die geringe Wahrscheinlichkeit 7 : 993 (d. h. 1 : 142).