Die pythagoräische Stimmung basiert auf reinen Quinten. Weil jedoch zwölf aufeinander gestapelte Quinten gegenüber sieben Oktaven um das pythagoräische Komma (23,46 Cent) zu hoch sind, ist der Kreis nicht geschlossen. Somit können nur elf Quinten rein gestimmt werden. Die 12. Quinte ist um das pythagoräische Komma zu klein und wird deshalb "pythagoräische Wolfsquinte" genannt.
Das Problem der pythagoräischen Stimmung besteht darin, dass als Resultat der rein gestimmten Quinten die Terz viel zu hoch ist, nämlich 407,82 Cent gegenüber der reinen Terz mit 386,31 Cent. Diese Differenz wird "syntonisches" oder "didymisches" Komma genannt und beträgt 21,51 Cent.

Geschichtlich gesehen wurden ja nicht alle zwölf resp. gar noch mehr Töne benutzt: Im Hochmittelalter bestand das Tonmaterial meist aus sieben bis neun Tönen, nämlich (B) - F - C - G - D - A - E - H - (Fis). B und Fis dienten hauptsächlich dazu, den als "diabolus in musica" empfundenen Tritonus F - H durch die reinen Quarten Fis - H resp. F - B umgehen zu können.

Die italienischen Komponisten des Trecento (14. Jahrhunderts) begannen, die Terz als konsonantes Intervall einzuführen. Der grundlegende Wandel der Hörgewohnheiten setzte aber erst in der zweiten Hälfte des 15. Jahrhunderts ein: Die Terz wurde allmählich als konsonant und dafür die Quarte als dissonant empfunden. Die pythagoräische Stimmung mit der zu hohen Terz war hierfür nicht geeignet. Mit einem Trick könnte eine Abhilfe geschaffen worden sein:
Die Wolfsquinte kann verschoben, also z.B. zwischen H und Fis gelegt werden, so dass nun folgende zwölf Töne zur Verfügung standen: Ges - Des - As - Es - B - F - C - G - D - A - E - H.
Die verminderten Quarten D - Ges, E - As, A - Des und H - Es sind so klein, dass sie wie fast reine Terzen klingen (384,32 Cent gegenüber der reinen Terz mit 386,31 Cent) – also als D - Fis, E - Gis, A- Cis und H- Dis gebraucht worden sein könnten! Dies weist schon darauf hin, dass die pythagoräische und die mitteltönige Stimmung wesensverwandt sind: Eigentlich werden die Systeme nur umgekehrt!

Somit war das sinnliche Erleben der reinen grossen Terz möglich und es war nur eine Frage der Zeit, bis die Stimmung theoretisch beschrieben wurde, die auf reinen grossen Terzen aufbaut und die "Schummelei" mit der verminderten Quarte beseitigte: die mitteltönige Stimmung.