Những ý niệm của chúng ta hiện nay về chuyển động của vật thể bắt nguồn từ Galileo và Newton. Trước họ, người ta tin Aristotle, người đã nói rằng trạng thái tự nhiên của một vật là đứng yên, và nó chỉ chuyển động dưới tác dụng của một lực hoặc một xung lực. Từ đó suy ra rằng, vật nặng sẽ rơi nhanh hơn vật nhẹ, bởi vì nó có một lực kéo xuống đất lớn hơn.
Truyền thống Aristotle cũng cho rằng người ta có thể rút ra tất cả các định luật điều khiển vũ trụ chỉ bằng tư duy thuần túy, nghĩa là không cần kiểm tra bằng quan sát. Như vậy, cho tới tận Galileo không có ai băn khoăn thử quan sát xem có thực là các vật có trọng lượng khác nhau sẽ rơi với vận tốc khác nhau hay không. Người ta kể rằng Galieo đã chứng minh niềm tin của Aristotle là sai bằng cách thả những vật có trọng lượng khác nhau từ tháp nghiêng Pisa. Câu chuyện này chắn hẳn là không có thật, nhưng Galileo đã làm một việc tương đương: ông thả những viên bi có trọng lượng khác nhau trên một mặt phẳng nghiêng nhẵn. Tình huống ở đây cũng tương tự như tình huống của các vật rơi theo phương thẳng đứng, nhưng có điều nó dễ quan sát hơn vì vận tốc của các vật nhỏ hơn. Các phép đo của Galileo chỉ ra rằng các vật tăng tốc với một nhịp độ như nhau bất kể trọng lượng của nó bằng bao nhiêu. Ví dụ, nếu bạn thả một viên bi trên một mặt phẳng nghiêng có độ nghiêng sao cho cứ 10 m dọc theo mặt phẳng thì độ cao lại giảm 1m, thì viên bi sẽ lăn xuống với vận tốc 1m/s sau 1 giây, 2m/s sau 2 giây… bất kể viên bi nặng bao nhiêu. Tất nhiên, viên bi bằng chì sẽ rơi nhanh hơn một chiếc lông chim, nhưng chiếc lông chim bị làm chậm lại chỉ vì sức cản của không khí mà thôi. Nếu thả hai vật không chịu nhiều sức cản không khí, ví dụ như hai viên bi đều bằng chì, nhưng có trọng lượng khác nhau, thì chúng sẽ rơi nhanh như nhau.
Những phép đo của Galileo đã được Newton sử dụng làm cơ sở cho những định luật về chuyển động của ông. Trong những thực nghiệm của Galileo, khi một vật lăn trên mặt phẳng nghiêng, nó luôn luôn chịu tác dụng của cùng một lực (là trọng lực của nó) và kết quả là làm cho vận tốc của nó tăng một cách đều đặn. Điều đó chứng tỏ rằng, hậu quả thực sự của một lực là luôn luôn làm thay đổi vận tốc của một vật, chứ không phải là làm cho nó chuyển động như người ta nghĩ trước đó. Điều này cũng có nghĩa là, bất cứ khi nào vật không chịu tác dụng của một lực, thì nó vẫn tiếp tục chuyển động thẳng với cùng một vận tốc. Ý tưởng này đã được phát biểu một cách tường minh lần đầu tiên trong cuốn Principia Mathematica (Các nguyên lý toán học), được công bố năm 1867, của Newton và sau này được biết như định luật thứ nhất của Newton. Định luật thứ hai của Newton cho biết điều gì sẽ xảy ra đối với một vật khi có một lực tác dụng lên nó. Định luật này phát biểu rằng vật sẽ có gia tốc, hay nói cách khác là sẽ thay đổi vận tốc tỷ lệ với lực tác dụng lên nó. (Ví dụ, gia tốc sẽ tăng gấp đôi, nếu lực tác dụng tăng gấp đôi). Gia tốc cũng sẽ càng nhỏ nếu khối lượng (lượng vật chất) của vật càng lớn.(Cùng một lực tác dụng lên vật có khối lượng lớn gấp hai lần sẽ tạo ra một gia tốc nhỏ hơn hai lần). Một ví dụ tương tự lấy ngay từ chiếc ô tô: động cơ càng mạnh thì gia tốc càng lớn, nhưng với cùng một động cơ, xe càng nặng thì gia tốc càng nhỏ.
Ngoài những định luật về chuyển động, Newton còn phát minh ra định luật về lực hấp dẫn. Định luật này phát biểu rằng mọi vật đều hút một vật khác với một lực tỉ lệ với khối lượng của mỗi vật. Như vậy lực giữa hai vật sẽ mạnh gấp đôi nếu một trong hai vật (ví dụ vật A) có khối lượng tăng gấp hai. Đây là điều bạn cần phải trông đợi bởi vì có thể xem vật mới A được làm từ hai vật có khối lượng ban đầu, và mỗi vật đó sẽ hút vật B với một lực ban đầu. Như vậy lực tổng hợp giữa A và B sẽ hai lần lớn hơn lực ban đầu. Và nếu, ví dụ, một trong hai vật có khối lượng hai lần lớn hơn và vật kia có khối lượng ba lần lớn hơn thì lực tác dụng giữa chúng sẽ sáu lần mạnh hơn. Bây giờ thì ta có thể hiểu tại sao các vật lại rơi với một gia tốc như nhau: một vật có trọng lượng lớn gấp hai lần sẽ chịu một lực hấp dẫn kéo xuống mạnh gấp hai lần, nhưng nó lại có khối lượng lớn gấp hai lần. Như vậy theo định luật 2 của Newton, thì hai kết quả này bù trừ chính xác cho nhau, vì vậy gia tốc của các vật là như nhau trong mọi trường hợp.
Định luật hấp dẫn của Newton cũng cho chúng ta biết rằng các vật càng ở xa nhau thì lực hấp dẫn càng nhỏ. Ví dụ, lực hút hấp dẫn của một ngôi sao đúng bằng một phần tư lực hút của một ngôi sao tương tự, nhưng ở khoảng cách giảm đi một nửa. Định luật này tiên đoán quỹ đạo của trái đất, mặt trăng và các hành tinh với độ chính xác rất cao. Nếu định luật này khác đi, chẳng hạn, lực hút hấp dẫn của một ngôi sao giảm theo khoảng cách nhanh hơn, thì quỹ đạo của các hành tinh không còn là hình elip nữa, mà chúng sẽ là những đường xoắn ốc về phía mặt trời. Nếu lực đó lại giảm chậm hơn, thì lực hấp dẫn từ các ngôi sao xa sẽ lấn át lực hấp dẫn từ mặt trời.
Sự khác biệt to lớn giữa những tư tưởng của Aristotle và những tư tưởng của Galileo và Newton là ở chỗ Aristotle tin rằng trạng thái đứng yên là trạng thái được “ưa thích” hơn của mọi vật – mọi vật sẽ lấy trạng thái đó, nếu không có một lực hoặc xung lực nào tác dụng vào nó. Đặc biệt, ông cho rằng trái đất là đứng yên. Nhưng từ những định luật của Newton suy ra rằng không có một tiêu chuẩn đơn nhất cho sự đứng yên. Người ta hoàn toàn có quyền như nhau khi nói rằng, vật A là đứng yên và vật B chuyển động với vận tốc không đổi đối với vật A hoặc vật B là đứng yên và vật A chuyển động. Ví dụ, nếu tạm gác ra một bên chuyển động quay của trái đất quanh trục của nó và quỹ đạo của nó xung quanh mặt trời, người ta có thể nói rằng trái đất là đứng yên và đoàn tàu trên nó chuyển động về phía bắc với vận tốc 90 dặm một giờ hoặc đoàn tàu là đứng yên còn trái đất chuyển động về phía nam cũng với vận tốc đó. Nếu người ta tiến hành những thí nghiệm của chúng ta với các vật chuyển động trên con tàu đó thì tất cả các định luật của Newton vẫn còn đúng. Ví dụ, khi đánh bóng bàn trên con tàu đó, người ta sẽ thấy rằng quả bóng vẫn tuân theo các định luật của Newton hệt như khi bàn bóng đặt cạnh đường ray. Như vậy không có cách nào cho phép ta nói được là con tàu hay trái đất đang chuyển động.
Việc không có một tiêu chuẩn tuyệt đối cho sự đứng yên có nghĩa là người ta không thể xác định được hai sự kiện xảy ra ở hai thời điểm khác nhau có cùng ở một vị trí trong không gian hay không. Ví dụ, giả sử quả bóng bàn trên con tàu nảy lên và rơi xuống chạm bàn ở cùng một chỗ sau khoảng thời gian 1 giây. Đối với người đứng cạnh đường ray thì hai lần chạm bàn đó xảy ra ở hai vị trí cách nhau 40 m vì con tàu chạy được quãng đường đó trong khoảng thời gian giữa hai lần quả bóng chạm bàn. Sự không tồn tại sự đứng yên tuyệt đối, vì vậy, có nghĩa là người ta không thể gán cho một sự kiện một vị trí tuyệt đối trong không gian, như Aristotle đã tâm niệm. Vị trí của các sự kiện và khoảng cách giữa chúng là khác nhau đối với người ở trên tàu và người đứng cạnh đường ray và chẳng có lý do gì để thích vị trí của người này hơn vị trí của người kia.
Newton là người rất băn khoăn về sự không có vị trí tuyệt đối, hay như người ta vẫn gọi là không có không gian tuyệt đối, vì điều đó không phù hợp với ý niệm của ông về Thượng đế tuyệt đối. Thực tế, Newton đã chối bỏ, không chấp nhận sự không tồn tại của không gian tuyệt đối, mặc dù thậm chí điều đó đã ngầm chứa trong những định luật của ông. Ông đã bị nhiều người phê phán nghiêm khắc vì niềm tin phi lý đó, mà chủ yếu nhất là bởi Giám mục Berkeley, một nhà triết học tin rằng mọi đối tượng vật chất và cả không gian lẫn thời gian chỉ là một ảo ảnh. Khi người ta kể cho tiến sĩ Johnson nổi tiếng về quan điểm của Berkeley, ông kêu lớn: “Tôi sẽ bác bỏ nó như thế này này!” và ông đá ngón chân cái vào một hòn đá lớn.
Cả Aristotle lẫn Newton đều tin vào thời gian tuyệt đối. Nghĩa là, họ tin rằng người ta có thể đo một cách đàng hoàng khoảng thời gian giữa hai sự kiện, rằng thời gian đó hoàn toàn như nhau dù bất kỳ ai tiến hành đo nó, miễn là họ dùng một chiếc đồng hồ tốt. Thời gian hoàn toàn tách rời và độc lập với không gian. Đó là điều mà nhiều người xem là chuyện thường tình. Tuy nhiên, đến lúc chúng ta phải thay đổi những ý niệm của chúng ta về không gian và thời gian. Mặc dù những quan niệm thông thường đó của chúng ta vẫn có kết quả tốt khi đề cập tới các vật như quả táo hoặc các hành tinh là những vật chuyển động tương đối chậm, nhưng chúng sẽ hoàn toàn không dùng được nữa đối với những vật chuyển động với vận tốc bằng hoặc gần bằng vận tốc ánh sáng.
Năm 1676, nhà thiên văn học Đan Mạch Ole Christensen Roemer là người đầu tiên phát hiện ra rằng ánh sáng truyền với vận tốc hữu hạn, mặc dù rất lớn. Ông quan sát thấy rằng thời gian để các mặt trăng của sao Mộc xuất hiện sau khi đi qua phía sau của hành tinh đó không cách đều nhau như người ta chờ đợi, nếu các mặt trăng đó chuyển động vòng quanh sao Mộc với vận tốc không đổi. Khi trái đất và sao Mộc quanh xung quanh mặt trời, khoảng cách giữa chúng thay đổi. Roemer thấy rằng sự che khuất các mặt trăng của sao Mộc xuất hiện càng muộn khi chúng ta càng ở xa hành tinh đó. Ông lý luận rằng điều đó xảy ra là do ánh sáng từ các mặt trăng đó đến chúng ta mất nhiều thời gian hơn khi chúng ta ở xa chúng hơn. Tuy nhiên, do những phép đo của ông về sự biến thiên khoảng cách giữa trái đất và sao Mộc không được chính xác lắm, nên giá trị vận tốc ánh sáng mà ông xác định được là 140.000 dặm/s, trong khi giá trị hiện nay đo được của vận tốc này là 186.000 dặm/s (khoảng 300.000 km/s). Dù sao thành tựu của Roemer cũng rất đáng kể, không chỉ trong việc chứng minh được rằng vận tốc của ánh sáng là hữu hạn, mà cả trong việc đo được vận tốc đó, đặc biệt nó lại được thực hiện 11 năm trước khi Newton cho xuất bản cuốn Principia Mathematica.
Một lý thuyết đích thực về sự truyền ánh sáng phải mãi tới năm 1865 mới ra đời, khi nhà vật lý người Anh James Clerk Maxwell đã thành công thống nhất hai lý thuyết riêng phần cho tới thời gian đó vẫn được dùng để mô tả riêng biệt các lực điện và từ. Các phương trình của Maxwell tiên đoán rằng có thể có những nhiễu động giống như sóng trong một trường điện từ kết hợp, rằng những nhiễu động đó sẽ được truyền với một vận tốc cố định giống như những gợn sóng trên hồ. Nếu bước sóng của những sóng đó (khoảng cách của hai đỉnh sóng liên tiếp) là một mét hoặc lớn hơn, thì chúng được gọi là sóng radio (hay sóng vô tuyến). Những sóng có bước sóng ngắn hơn được gọi là sóng cực ngắn (với bước sóng vài centimet) hoặc sóng hồng ngoại (với bước sóng lớn hơn mười phần ngàn centimet). Ánh sáng thấy được có bước sóng nằm giữa bốn mươi phần triệu đến tám mươi phần triệu centimet. Những sóng có bước sóng còn ngắn hơn nữa là tia tử ngoại, tia – X và các tia gamma.
Lý thuyết của Maxwell tiên đoán các sóng vô tuyến và sóng ánh sáng truyền với một vận tốc cố định nào đó. Nhưng lý thuyết của Newton đã gạt bỏ khái niệm đứng yên tuyệt đối, vì vậy nếu ánh sáng được giả thiết là truyền với một vận tốc cố định, thì cần phải nói vận tốc cố định đó là đối với cái gì. Do đó người ta cho rằng có một chất gọi là “ether” có mặt ở khắp mọi nơi, thậm chí cả trong không gian “trống rỗng”. Các sóng ánh sáng truyền qua ether như sóng âm truyền trong không khí, và do vậy, vận tốc của chúng là đối với ether. Những người quan sát khác nhau chuyển động đối với ether sẽ thấy ánh sáng đi tới mình với những vận tốc khác nhau, nhưng vận tốc của ánh sáng đối với ether luôn luôn có một giá trị cố định. Đặc biệt, vì trái đất chuyển động qua ether trên quỹ đạo quay quanh mặt trời, nên vận tốc của ánh sáng được đo theo hướng chuyển động của trái đất qua ether (khi chúng ta chuyển động tới gần nguồn sáng) sẽ phải lớn hơn vận tốc của ánh sáng hướng vuông góc với phương chuyển động (khi chúng ta không chuyển động hướng tới nguồn sáng). Năm 1887, Albert Michelson (sau này trở thành người Mỹ đầu tiên nhận được giải thưởng Nobel về vật lý) và Edward Morley đã thực hiện một thực nghiệm rất tinh xảo tại trường Khoa học ứng dụng Case ở Cleveland. Họ đã so sánh vận tốc ánh sáng theo hướng chuyển động của trái đất với vận tốc ánh sáng hướng vuông góc với chuyển động của trái đất. Và họ đã vô cùng ngạc nhiên khi thấy rằng hai vận tốc đó hoàn toàn như nhau!
Giữa năm 1887 và năm 1905 có một số ý định, mà chủ yếu là của vật lý người Hà Lan Hendrik Lorentz, nhằm giải thích kết quả của thí nghiệm Michelson – Morley bằng sự co lại của các vật và sự chậm lại của đồng hồ khi chúng chuyển động qua ether. Tuy nhiên, trong bài báo công bố vào năm 1905, Albert Einstein, một nhân viên thuộc văn phòng cấp bằng sáng chế phát minh ở Thụy Sĩ, người mà trước đó còn chưa ai biết tới, đã chỉ ra rằng toàn bộ ý tưởng về ether là không cần thiết nếu người ta sẵn lòng vứt bỏ ý tưởng về thời gian tuyệt đối. Quan niệm tương tự cũng đã được một nhà toán học hàng đầu của Pháp là Henri Poincaré đưa ra chỉ ít tuần sau. Tuy nhiên, những lý lẽ của Einstein gần với vật lý hơn Poincaré, người đã xem vấn đề này như một vấn đề toán học. Công lao xây dựng nên lý thuyết mới này thường được thừa nhận là của Einstein, nhưng Poincaré vẫn thường được nhắc nhở tới và tên tuổi của ông gắn liền với một phần quan trọng của lý thuyết đó.
Tiên đề cơ bản của lý thuyết mới – mà người ta thường gọi là thuyết tương đối – được phát biểu như sau: mọi định luật của khoa học là như nhau đối với tất cả những người quan sát chuyển động tự do bất kể vận tốc của họ là bao nhiêu. Điều này đúng đối với các định luật của Newton về chuyển động, nhưng bây giờ lý thuyết đó được mở rộng ra bao hàm cả lý thuyết của Maxwell và vận tốc ánh sáng: mọi người quan sát đều đo được vận tốc ánh sáng có giá trị hoàn toàn như nhau bất kể họ chuyển động nhanh, chậm như thế nào. Ý tưởng đơn giản đó có một số hệ quả rất đáng chú ý. Có lẽ nổi tiếng nhất là hệ quả về sự tương đương của khối lượng và năng lượng được đúc kết trong phương trình nổi tiếng của Einstein: E = mc2 và định luật nói rằng không có vật nào có thể chuyển động nhanh hơn ánh sáng. Vì có sự tương đương giữa năng lượng và khối lượng nên năng lượng mà vật có thể nhờ chuyển động sẽ làm tăng khối lượng của nó. Nói một cách khác, nó sẽ làm cho việc tăng vận tốc của vật trở nên khó khăn hơn.
Hiệu ứng này chỉ trực sự quan trọng đối với các vật chuyển động với vận tốc gần với vận tốc ánh sáng. Ví dụ, vận tốc chỉ bằng 10 % vận tốc ánh sáng khối lượng của vật chỉ tăng 0,5 % so với khối lượng bình thường, trong khi vận tốc bằng 90 % vận tốc ánh sáng khối lượng của nó còn tăng nhanh hơn, vì vậy sẽ càng mất nhiều năng lượng hơn để tăng vận tốc của nó lên nữa. Thực tế không bao giờ có thể đạt tới vận tốc của ánh sáng vì khi đó khối lượng của vật sẽ trở thành vô hạn và do sự tương đương giữa năng lượng và khối lượng, sẽ phải tốn một lượng vô hạn năng lượng để đạt được điều đó. Vì lý do đó, một vật bình thường vĩnh viễn bị tính tương đối giới hạn chuyển động chỉ chuyển động với vận tốc nhỏ hơn vận tốc ánh sáng. Chỉ có ánh sáng hoặc các sóng khác không có khối lượng nội tại là có thể chuyển động với vận tốc ánh sáng.
Một hệ quả cũng đáng chú ý không kém của thuyết tương đối là nó đã làm cách mạng những ý niệm của chúng ta về không gian và thời gian. Trong lý thuyết của Newton, nếu một xung ánh sáng được gửi từ nơi này đến nơi khác thì những người quan sát khác nhau đều nhất trí với nhau về thời gian truyền xung ánh sáng đó (vì thời gian là tuyệt đối). Vì vận tốc ánh sáng chính bằng khoảng cách mà nó truyền được chia cho thời gian đã tốn để đi hết quãng đường đó, nên những người quan sát khác nhau sẽ đo được vận tốc của ánh sáng có giá trị khác nhau. Trong thuyết tương đối, trái lại, mọi người quan sát đều phải nhất trí về giá trị vận tốc của ánh sáng. Tuy nhiên, họ vẫn còn không nhất trí về khoảng cách mà ánh sáng đã truyền, vì vậy họ cũng phải không nhất trí về thời gian mà ánh sáng đã tốn (thời gian này bằng khoảng cách ánh sáng đã truyền – điều mà các nhà quan sát không nhất trí – chia cho vận tốc ánh sáng – điều mà các nhà quan sát đều nhất trí). Nói một cách khác, lý thuyết tương đối đã cáo chung cho ý tưởng về thời gian tuyệt đối! Hóa ra là mỗi người quan sát cần phải có một bộ đo thời gian riêng của mình như được ghi nhận bởi đồng hồ mà họ mang theo và các đồng hồ giống hệt nhau được mang bởi những người quan sát khác nhau không nhất thiết phải chỉ như nhau.
Mỗi một người quan sát có thể dùng radar để biết một sự kiện xảy ra ở đâu và khi nào bằng cách gửi một xung ánh sáng hoặc sóng vô tuyến. Một phần của xung phản xạ từ sự kiện trở về và người quan sát đo thời gian mà họ nhận được tiếng dội. Thời gian xảy ra sự kiện khi đó sẽ bằng một nửa thời gian tính từ khi xung được gửi đi đến khi nhận được tiếng dội trở lại, còn khoảng cách tới sự kiện bằng nửa số thời gian cho hai lượt đi-về đó nhân với vận tốc ánh sáng. (Một sư kiện, theo ý nghĩa này, là một điều gì đó xảy ra ở một điểm duy nhất trong không gian và ở một điểm xác định trong thời gian).
Ý tưởng này được minh họa trên hình 2.1, nó là một ví dụ về giản đồ không-thời gian. Dùng thủ tục này, những người quan sát chuyển động đối với nhau sẽ gán cho cùng một sự kiện những thời gian và vị trí khác nhau. Không có những phép đo của người quan sát đặc biệt nào là đúng hơn những người khác, nhưng tất cả các phép đo đều quan hệ với nhau. Bất kỳ một người quan sát nào cũng tính ra được một cách chính xác thời gian và vị trí mà một người quan sát khác gán cho một sự kiện, miễn là người đó biết được vận tốc tương đối của người kia.
Ngày hôm nay để đo khoảng cách một cách chính xác, chúng ta vẫn còn dùng phương pháp nói trên, bởi vì chúng ta có thể đo thời gian chính xác hơn đo chiều dài. Thực tế, mét được định nghĩa là khoảng cách mà ánh sáng đi được trong khoảng thời gian 0,000000003335640952 giây đo theo đồng hồ nguyên tử xesi. (Nguyên nhân dẫn tới con số lạ lùng này là để nó tương ứng với định nghĩa có tính chất lịch sử của mét: là khoảng cách giữa hai vạch trên một cái thước đặc biệt làm bằng bạch kim được giữ ở Paris). Như vậy chúng ta có thể dùng một đơn vị mới thuận tiện hơn, được gọi là giây-ánh-sáng. Nó đơn giản là khoảng cách mà ánh sáng đi được trong một giây. Trong lý thuyết tương đối, bây giờ ta định nghĩa khoảng cách thông qua thời gian và vận tốc ánh sáng, như vậy phải tự động suy ra rằng mọi người quan sát đo vận tốc của ánh sáng sẽ nhận được cùng một giá trị (theo định nghĩa là 1 mét trong 0,000000003335640952 giây). Khỏi cần phải đưa vào khái niệm ether, và lại sự có mặt của nó không thể được ghi nhận bằng cách nào, như thí nghiệm của Michelson – Morley đã chứng tỏ.
Tuy nhiên, lý thuyết tương đối buộc chúng ta phải thay đổi một cách căn bản những ý niệm của chúng ta về không gian và thời gian. Chúng ta buộc phải chấp nhận rằng thời gian không hoàn toàn tách rời và độc lập với không gian mà kết hợp với nó thành một đối tượng gọi là không – thời gian.
Theo kinh nghiệm thông thường, người ta có thể mô tả vị trí của một điểm trong không gian bằng ba con số, hay nói cách khác là ba tọa độ. Ví dụ, người ta có thể nói: một điểm ở trong phòng cách một bức tường 7 bộ, cách một bức tường khác 3 bộ, và cao so với sàn 5 bộ. Hoặc người ta có thể chỉ rõ một điểm ở kinh tuyến nào, vĩ tuyến bao nhiêu và ở độ cao nào so với mực nước biển. Người ta có thể thoải mái dùng ba tọa độ thích hợp nào mà mình muốn, mặc dù chúng chỉ có phạm vi ứng dụng hạn chế. Chẳng hạn, chúng ta sẽ không chỉ vị trí của mặt trăng bằng khoảng cách theo phương bắc và phương tây so với rạp xiếc Piccadilly và chiều cao của nó so với mực nước biển. Thay vì thế, người ta cần phải mô tả nó qua khoảng cách từ mặt trời, khoảng cách từ mặt phẳng quĩ đạo của các hành tinh và góc giữa đường nối mặt trăng với mặt trời và đường nối mặt trời tới một ngôi sao ở gần như sao Alpha của chòm sao Nhân Mã. Nhưng thậm chí những tọa độ này cũng không được dùng nhiều để mô tả vị trí của mặt trời trong thiên hà của chúng ta hoặc của thiên hà chúng ta trong quần thể thiên hà khu vực. Thực tế, người ta có thể mô tả toàn bộ vũ trụ bằng một tập hợp các mảng gối lên nhau. Trong mỗi một mảng, người ta có thể dùng một tập hợp ba tọa độ khác nhau để chỉ vị trí của các điểm.
Một sự kiện là một cái gì đó xảy ra ở một điểm đặc biệt trong không gian và ở một thời điểm đặc biệt. Như vậy, người ta có thể chỉ nó bằng 4 con số hay là 4 tọa độ. Và lần này cũng thế, việc lựa chọn các tọa độ là tùy ý, người ta có thể dùng ba tọa độ không gian đã biết và một độ đo nào đó của thời gian. Trong thuyết tương đối, không có sự phân biệt thực sự giữa các tọa độ không gian và thời gian, cũng hệt như không có sự khác biệt thực sự giữa hai tọa độ không gian. Người ta có thể chọn một tập hợp tọa độ mới, trong đó, chẳng hạn, tọa độ không gian thứ nhất là tổ hợp của tọa độ không gian cũ thứ nhất và thứ hai. Ví dụ, thay vì đo vị trí của một điểm trên mặt đất bằng khoảng cách theo phương bắc và tây của nó đối với rạp xiếc Piccadilly người ta có thể dùng khoảng cách theo hướng đông bắc và tây bắc đối với Piccadilly. Cũng tương tự như vậy, trong thuyết tương đối, người ta có thể dùng tọa độ thời gian mới là thời gian cũ (tính bằng giây) cộng với khoảng cách (tính bằng giây – ánh sáng) theo hướng bắc của Piccadilly.
Một cách rất hữu ích để suy nghĩ về bốn tọa độ của một sự kiện là chỉ vị trí của nó trong một không gian 4 chiều, được gọi là không -thời gian. Chúng ta không thể tưởng tượng nổi một không gian 4 chiều. Riêng bản thân tôi hình dung một không gian 3 chiều cũng đã vất vả lắm rồi. Tuy nhiên vẽ một sơ đồ về không gian 2 chiều thì lại khá dễ dàng, chẳng hạn như vẽ bề mặt của trái đất (Bề mặt của trái đất là hai chiều vì vị trí của một điểm trên đó có thể được ghi bằng hai tọa độ, kinh độ và vĩ độ). Tôi sẽ thường sử dụng những giản đồ trong đó thời gian tăng theo phương thẳng đứng hướng lên trên, còn một trong những chiều không gian được vẽ theo phương nằm ngang. Hai chiều không gian còn lại sẽ bỏ qua, hoặc đôi khi một trong hai chiều đó được vẽ theo phối cảnh. (Những giản đồ này được gọi là giản đồ không-thời gian, giống như hình 2.1). Ví dụ, trong hình 2.2 thời gian được đặt hướng lên trên với đơn vị là năm, còn khoảng cách nằm dọc theo đường thẳng nối mặt trời với sao Anpha của chòm sao Nhân mã được đặt nằm ngang với đơn vị là dặm. Những con đường của mặt trời và sao Alpha qua không – thời gian là những con đường thẳng đứng ở bên trái và bên phải của giản đồ. Tia sáng từ mặt trời đi theo đường chéo và phải mất 4 năm mới tới được sao Alpha.
Như chúng ta đã thấy, các phương trình Maxwell tiên đoán rằng vận tốc của ánh sáng sẽ là như nhau bất kể vận tốc của nguồn sáng bằng bao nhiêu, và điều này đã được khẳng định bằng nhiều phép đo chính xác.
Điều này suy ra từ sự kiện là nếu một xung ánh sáng được phát ra ở một thời điểm đặc biệt, tại một điểm đặc biệt trong không gian, thì sau đó với thời gian nó sẽ lan ra như một mặt cầu ánh sáng với kích thước và vị trí không phụ thuộc vào vận tốc của nguồn sáng. Sau một phần triệu giây, ánh sáng sẽ lan truyền, tạo thành một mặt cầu có bán kính 300 mét, sau hai phần triệu giây, bán kính là 600 mét, và cứ như vậy mãi. Điều này cũng giống như những gợn sóng truyền trên mặt nước khi có hòn đá ném xuống hồ.
Những gợn sóng truyền như một vòng tròn cứ lớn dần mãi theo thời gian. Nếu ta nghĩ về một mô hình ba chiều gồm bề mặt hai chiều của hồ và một chiều thời gian thì vòng tròn lớn dần của các gợn sóng sẽ tạo thành một nón có đỉnh nằm đúng tại chỗ và tại thời điểm hòn đá chạm vào mặt nước (hình 2.3). Tương tự, ánh sáng lan truyền từ một sự kiện sẽ tạo nên một mặt nón ba chiều trong không-thời gian 4 chiều. Mặt nón đó được gọi là mặt nón ánh sáng tương lai của sự kiện đang xét. Cũng bằng cách như vậy ta có thể dựng một mặt nón khác, gọi là mặt nón ánh sáng quá khứ – đó là tập hợp các sự kiện mà từ chúng một xung ánh sáng có thể tới được sự kiện đang xét ( hình 2.4).
Những mặt nón ánh sáng quá khứ và tương lai của một sự kiện P chia không gian thành ba miền (hình 2.5.). Tương lai tuyệt đối của sự kiện là vùng nằm trong mặt nón ánh sáng tương lai của P. Đây là tập hợp của tất cả các sự kiện có thể chịu ảnh hưởng của những điều xảy ra ở P.
Những tín hiệu từ P không thể tới được những sự kiện nằm ngoài nón ánh sáng của P bởi vì không gì có thể chuyển động nhanh hơn ánh sáng. Do vậy mà các sự kiện đó không chịu ảnh hưởng những gì xảy ra ở P. Quá khứ tuyệt đối của P là vùng nằm trong nón ánh sáng quá khứ. Đây là tập hợp các sự kiện mà từ đó những tín hiệu truyền với vận tốc bằng hoặc nhỏ hơn vận tốc của ánh sáng có thể tới được P. Do đó, tập hợp những sự kiện này có thể ảnh hưởng tới những gì xảy ra ở P. Nếu biết được ở một thời điểm đặc biệt nào đó những gì xảy ra ở mọi nơi trong vùng không gian nằm trong nón ánh sáng quá khứ của P thì người ta có thể tiên đoán những gì sẽ xảy ra ở P.
Phần còn lại là vùng không – thời gian không nằm trong nón ánh sáng tương lai hoặc quá khứ của P. Các sự kiện trong phần còn lại này không thể ảnh hưởng hoặc chịu ảnh hưởng bởi những sự kiện ở P. Ví dụ, nếu mặt trời ngừng chiếu sáng ở chính thời điểm này, thì nó sẽ không ảnh hưởng tới các sự kiện trên trái đất ở ngay thời điểm đó bởi vì chúng nằm ngoài nón ánh sáng của ánh sáng khi mặt trời tắt (hình 2.6). Chúng ta sẽ biết về sự kiện đó chỉ sau 8 phút – là thời gian đủ để ánh sáng đi từ mặt trời đến trái đất. Và chỉ khi này những sự kiện trên trái đất mới nằm trong nón ánh sáng tương lai của sự kiện ở đó mặt trời tắt. Tương tự như vậy, ở thời điểm hiện nay chúng ta không thể biết những gì đang xảy ra ở những nơi xa xôi trong vũ trụ, bởi vì ánh sáng mà chúng ta thấy từ những thiên hà xa xôi đã rời chúng từ hàng triệu năm trước. Như vậy, khi chúng ta quan sát vũ trụ thì thực ra là chúng ta đang thấy nó trong qúa khứ.
Nếu người ta bỏ qua những hiệu ứng hấp dẫn, như Einstein và Poincaré đã làm năm 1905, thì ta có thuyết tương đối được gọi là thuyết tương đối hẹp. Đối với mỗi sự kiện trong không-thời gian ta đều có thể dựng một nón ánh sáng (là tập hợp mọi con đường khả dĩ của ánh sáng trong không-thời gian được phát ra ở sự kiện đó), và vì vận tốc ánh sáng là như nhau ở mỗi sự kiện và theo mọi hướng, nên tất cả các nón ánh sáng là như nhau và cùng hướng theo một hướng. Lý thuyết này cũng nói với chúng ta rằng không gì có thể chuyển động nhanh hơn ánh sáng. Điều đó có nghĩa là đường đi của mọi vật qua không-thời gian cần phải được biểu diễn bằng một đường nằm trong nón ánh sáng ở mỗi một sự kiện trên nó (hình 2.7.).
Lý thuyết tương đối hẹp rất thành công trong việc giải thích sự như nhau của vận tốc ánh sáng đối với mọi người quan sát (như thí nghiệm Michelson – Morley đã chứng tỏ) và trong sự mô tả những điều xảy ra khi các vật chuyển động với vận tốc gần với vận tốc ánh sáng. Tuy nhiên, lý thuyết này lại không hòa hợp với thuyết hấp dẫn của Newton nói rằng các vật hút nhau với một lực phụ thuộc vào khoảng cách giữa chúng. Điều này có nghĩa là, nếu làm cho một vật chuyển động thì lực tác dụng lên các vật khác sẽ thay đổi ngay lập tức. Hay nói một cách khác, các tác dụng hấp dẫn truyền với vận tốc vô hạn, thay vì nó bằng hoặc nhỏ hơn vận tốc ánh sáng như thuyết tương đối hẹp đòi hỏi.
Trong khoảng thời gian từ năm 1908 đến năm 1914, Einstein đã nhiều lần thử tìm một lý thuyết hấp dẫn hòa hợp được với thuyết tương đối hẹp, nhưng đã không thành công. Cuối cùng, vào năm 1915, ông đã đưa ra được một lý thuyết mà ngày nay chúng ta gọi là thuyết tương đối rộng (hay thuyết tương đối tổng quát). Ông đã đưa ra một giả thiết có tính chất cách mạng cho rằng hấp dẫn không phải là một lực giống như những lực khác mà nó là kết quả của sự kiện là: không – thời gian không phải phẳng như trước kia người ta vẫn tưởng, mà nó cong hay “vênh” đi do sự phân bố của khối lượng và năng lượng trong nó. Các vật như trái đất không phải được tạo ra để chuyển động trên các quĩ đạo cong bởi lực hấp dẫn, mà thay vì thế, chúng chuyển động theo đường rất gần với đường thẳng trong không gian cong mà người ta gọi là đường trắc địa. Đường trắc địa là đường ngắn nhất (hoặc dài nhất) giữa hai điểm cạnh nhau. Ví dụ, bề mặt trái đất là một không gian cong hai chiều.
Đường trắc địa trên mặt trái đất chính là vòng tròn lớn và nó là đường ngắn nhất giữa hai điểm trên mặt đất (H.2.8). Vì đường trắc địa là đường ngắn nhất giữa hai sân bay, nên nó là đường mà những người dẫn đường hàng không hướng các phi công bay theo. Trong lý thuyết tương đối rộng, các vật luôn luôn chuyển động theo các đường “thẳng” trong không-thời gian 4 chiều, nhưng đối với chúng ta, chúng có vẻ chuyển động theo những đường cong trong không gian 3 chiều. (Điều này rất giống với việc quan sát chiếc máy bay trên một vùng đồi gò. Mặc dù nó bay theo đường thẳng trong không gian 3 chiều, nhưng cái bóng của nó lại chuyển động theo một đường cong trên mặt đất hai chiều).
Khối lượng của mặt trời làm cong không-thời gian theo cách sao cho mặc dù trái đất chuyển động theo đường thẳng trong không-thời gian 4 chiều, nhưng nó lại thể hiện đối với chúng ta là chuyển động theo quĩ đạo tròn trong không gian ba chiều. Và thực tế, quĩ đạo của các hành tinh được tiên đoán bởi lý thuyết tương đối rộng cũng chính xác như được tiên đoán bởi lý thuyết hấp dẫn của Newton. Tuy nhiên, trong trường hợp đối với sao Thủy, hành tinh gần mặt trời nhất, do đó cảm thấy hiệu ứng hấp dẫn mạnh nhất và có quĩ đạo thuôn dài hơn, thì thuyết tương đối rộng tiên đoán rằng trục dài của elip quĩ đạo quay quanh mặt trời với vận tốc 1 độ trong 10 ngàn năm. Mặc dù hiệu ứng là rất nhỏ, nhưng nó đã được ghi nhận từ trước năm 1915 và được dùng như một bằng chứng đầu tiên khẳng định lý thuyết của Einstein. Trong những năm gần đây, những độ lệch thậm chí còn nhỏ hơn nữa của quĩ đạo các hành tinh khác so với những tiên đoán của lý thuyết Newton cũng đã được đo bằng rada và cho thấy chúng phù hợp với những tiên đoán của thuyết tương đối rộng.
Những tia sáng cũng cần phải đi theo những đường trắc địa trong không-thời gian. Cũng lại do không gian bị cong nên ánh sáng không còn thể hiện là truyền theo đường thẳng trong không gian nữa. Như vậy thuyết tương đối rộng tiên đoán rằng anh sáng có thể bị bẻ cong bởi các trường hấp dẫn. Ví dụ, lý thuyết này tiên đoán rằng nón ánh sáng của những điểm ở gần mặt trời sẽ hơi bị uốn hướng vào phía trong do tác dụng của khối lượng mặt trời. Điều này có nghĩa là ánh sáng từ một ngôi sao xa khi đi qua gần mặt trời có thể bị lệch đi một góc nhỏ, khiến cho đối với những người quan sát trên mặt đất, ngôi sao đó dường như ở một vị trí khác (H.2.9). Tất nhiên, nếu ánh sáng từ ngôi sao đó luôn luôn đi qua gần mặt trời, thì chúng ta không thể nói tia sáng có bị lệch hay không hoặc thay vì thế ngôi sao có thực sự nằm ở đúng chỗ chúng ta nhìn thấy nó hay không. Tuy nhiên, vì trái đất quay quanh mặt trời nên những ngôi sao khác nhau có lúc dường như đi qua phía sau mặt trời và ánh sáng của chúng bị lệch. Vì thế những ngôi sao này thay đổi vị trí biểu kiến của chúng đối với các ngôi sao khác.
Thường thì rất khó quan sát hiệu ứng này, bởi vì ánh sáng của mặt trời làm cho ta không thể quan sát được những ngôi sao có vị trí biểu kiến ở gần mặt trời trên bầu trời. Tuy nhiên, điều này có thể làm được trong thời gian có nhật thực, khi mà ánh sáng mặt trời bị mặt trăng chắn mất. Nhưng tiên đoán của Einstein không được kiểm chứng ngay lập tức trong năm 1915 vì cuộc chiến tranh thế giới lần thứ nhất lúc đó đang lan rộng, và phải tới tận năm 1919 một đoàn thám hiểm Anh khi quan sát nhật thực ở Tây Phi đã chứng tỏ được rằng ánh sáng thực sự bị lệch do mặt trời đúng như lý thuyết đã dự đoán. Sự chứng minh lý thuyết của một người Đức bởi các nhà khoa học Anh đã được nhiệt liệt hoan nghênh như một hành động hòa giải vĩ đại giữa hai nước sau chiến tranh. Do đó, thật là trớ trêu khi kiểm tra lại sau đó những bức ảnh mà đoàn thám hiểm đã chụp, người ta phát hiện ra rằng sai số cũng lớn cỡ hiệu ứng mà họ định đo. Phép đo của họ hoàn toàn chỉ là may mắn hoặc một trường hợp đã biết trước kết quả mà họ muốn nhận được – một điều cũng thường xảy ra trong khoa học. Tuy nhiên, sự lệch của tia sáng đã được khẳng định hoàn toàn chính xác bởi nhiều quan sát sau này.
Một tiên đoán khác của thuyết tương đối rộng là thời gian dường như chạy chậm hơn khi ở gần những vật có khối lượng lớn như trái đất. Đó là bởi vì một mối liên hệ giữa năng lượng của ánh sáng và tần số của nó (tần số là sóng ánh sáng trong một giây): năng lượng càng lớn thì tần số càng cao. Khi ánh sáng truyền hướng lên trong trường hấp dẫn của trái đất, nó sẽ mất năng lượng và vì thế tần số của nó giảm. (Điều này có nghĩa là khoảng thời gian giữa hai đỉnh sóng liên tiếp tăng lên). Đối với người ở trên cao mọi chuyện ở phía dưới xảy ra chậm chạp hơn. Điều tiên đoán này đã được kiểm chứng vào năm 1962 bằng cách dùng hai đồng hồ rất chính xác: một đặt ở đỉnh và một đặt ở chân một tháp nước. Đồng hồ ở chân tháp, gần trái đất hơn, chạy chậm hơn – hoàn toàn phù hợp với thuyết tương đối rộng. Sự khác biệt của tốc độ đồng hồ ở những độ cao khác nhau trên mặt đất có một tầm quan trọng đặc biệt trong thực tiễn hiện nay khi người ta sử dụng những hệ thống đạo hàng chính xác dựa trên những tín hiệu từ vệ tinh. Nếu khi này người ta bỏ qua những tiên đoán của thuyết tương đối rộng, thì vị trí tính toán được có thể sai khác tới vài ba dặm!
Những định luật về chuyển động của Newton đã đặt dấu chấm hết cho ý niệm về vị trí tuyệt đối trong không gian. Thuyết tương đối đã vứt bỏ khái niệm thời gian tuyệt đối. Ta hãy xét hai đứa trẻ sinh đôi. Giả sử rằng một đứa được đưa lên sống trên đỉnh núi và một đứa sống ở ngang mực nước biển. Đứa thứ nhất sẽ già nhanh hơn đứa thứ hai. Như vậy, nếu gặp lại nhau một đứa sẽ già hơn đứa kia. Trong trường hợp này sự khác nhau về tuổi tác sẽ rất nhỏ, nhưng nó sẽ lớn hơn rất nhiều nếu một đứa thực hiện chuyến du hành dài trong con tàu vũ trụ chuyển động với vận tốc gần vận tốc ánh sáng. Khi trở về nó sẽ trẻ hơn rất nhiều so với đứa ở lại trái đất. Điều này được gọi là nghịch lý hai đứa trẻ sinh đôi, nhưng nó là nghịch lý chỉ nếu ý niệm về thời gian tuyệt đối vẫn còn lẩn quất trong đầu óc chúng ta. Trong lý thuyết tương đối không có một thời gian tuyệt đối duy nhất, mà thay vì thế mỗi cá nhân có một độ đo thời gian riêng của mình và độ đo đó phụ thuộc vào nơi họ đang ở và họ chuyển động như thế nào.
Trước năm 1915, không gian và thời gian được xem là một sân khấu cố định nơi diễn ra mọi sự kiện và không chịu ảnh hưởng bởi những điều xảy ra trong nó. Điều này đúng thậm chí cả với thuyết tương đối hẹp. Các vật chuyển động, các lực hút và đẩy, nhưng không gian và thời gian vẫn liên tục và không bị ảnh hưởng gì. Và ý nghĩ cho rằng không gian và thời gian cứ tiếp tục như thế mãi mãi cũng là chuyện tự nhiên.
Tuy nhiên, tình hình hoàn toàn khác trong thuyết tương đối rộng. Bây giờ không gian và thời gian là những đại lượng động lực: khi một vật chuyển động, hoặc một lực tác dụng, chúng đều ảnh hưởng tới độ cong của không gian và thời gian và đáp lại, cấu trúc của không – thời gian sẽ ảnh hưởng tới cách thức mà các vật chuyển động và các lực tác dụng. Không gian và thời gian không chỉ có tác động mà còn bị tác động bởi mọi điều xảy ra trong vũ trụ. Chính vì người ta không thể nói về các sự kiện trong vũ trụ mà không có khái niệm về không gian và thời gian, nên trong thuyết tương đối rộng sẽ trở nên vô nghĩa nếu nói về không gian và thời gian ở ngoài giới hạn của vũ trụ. Trong những thập kỷ tiếp sau, sự nhận thức mới này về không gian và thời gian đã làm cách mạng quan niệm của chúng ta về vũ trụ. Ý tưởng xưa cũ cho rằng một vũ trụ căn bản không thay đổi có thể đã tồn tại và có thể còn tiếp tục tồn tại đã vĩnh viễn được thay thế bằng khái niệm một vũ trụ động, đang giãn nở, một vũ trụ dường như đã bắt đầu ở một thời điểm hữu hạn trong quá khứ và có thể chấm dứt ở một thời điểm hữu hạn trong tương lai. Cuộc cách mạng này là đề tài của chương tiếp sau. Và những năm sau đó nó cũng đã là điểm xuất phát cho hoạt động của tôi trong lĩnh vực vật lý lý thuyết. Roger Penrose và tôi đã chứng tỏ được rằng chính thuyết tương đối rộng đã ngụ ý vũ trụ cần phải có điểm bắt đầu và có thể cả điểm kết thúc nữa.