Explorando el "History"

Resumen

Enseñando: 25 min
Ejercicios: 0 min
Preguntas
  • ¿Cómo puedo identificar versiones anteriores de archivos?

  • ¿Cómo puedo revisar mis cambios?

  • ¿Cómo puedo recuperar versiones anteriores de archivos?

Objectivos
  • Explicar qué es el HEAD de un repositorio y cómo usarlo.

  • Identificar y usar el número de commit the Git.

  • Comparar varias versiones de archivos.

  • Restaurar versiones anteriores de archivos.

Como vimos en la lección anterior, podemos referirnos a los commits por sus identificadores. Puedes referirte al commit más reciente del directorio de trabajo usando el identificador HEAD.

Hemos estado agregando una línea a la vez a mars.txt, por lo que es fácil rastrear nuestro progreso, así que hagamos eso usando HEAD. Antes de iniciar, hagamos un cambio en mars.txt.

$ nano mars.txt
$ cat mars.txt
Cold and dry, but everything is my favorite color
The two moons may be a problem for Wolfman
But the Mummy will appreciate the lack of humidity

Ahora, veamos lo que tenemos.

$ git diff HEAD mars.txt
diff --git a/mars.txt b/mars.txt
index b36abfd..0848c8d 100644
--- a/mars.txt
+++ b/mars.txt
@@ -1,3 +1,4 @@
 Cold and dry, but everything is my favorite color
 The two moons may be a problem for Wolfman
 But the Mummy will appreciate the lack of humidity

Lo mismo obtendrías si omites HEAD (intentalo). La verdadera ventaja en todo esto es cuando puedes referirte a commits previos. Hacemos esto agregando ~1 para referirnos al commit inmediatamente anterior a HEAD.

$ git diff HEAD~1 mars.txt

Si queremos ver las diferencias entre commits anteriores podemos usar git diff nuevamente, pero con la notación HEAD~1,HEAD~2, y así sucesivamente, para referirse a ellos:

$ git diff HEAD~2 mars.txt
diff --git a/mars.txt b/mars.txt
index df0654a..b36abfd 100644
--- a/mars.txt
+++ b/mars.txt
@@ -1 +1,4 @@
 Cold and dry, but everything is my favorite color
+The two moons may be a problem for Wolfman
+But the Mummy will appreciate the lack of humidity

También podríamos usar git show, que nos muestra qué cambios hemos realizado en un commit anterior así como el mensaje del commit, en lugar de las diferencias entre un commit y nuestro directorio de trabajo, que vemos usando git diff.

$ git show HEAD~2 mars.txt
commit 34961b159c27df3b475cfe4415d94a6d1fcd064d
Author: Vlad Dracula <vlad@tran.sylvan.ia>
Date:   Thu Aug 22 10:07:21 2013 -0400

    Start notes on Mars as a base

diff --git a/mars.txt b/mars.txt
new file mode 100644
index 0000000..df0654a
--- /dev/null
+++ b/mars.txt
@@ -0,0 +1 @@
+Cold and dry, but everything is my favorite color

De este modo, podemos construir una cadena de commits. El más reciente de la cadena es referido como HEAD; podemos referirnos a commits anteriores utilizando la notación ~, así HEAD~1 (pronunciado “head minus one”) significa “el commit anterior”, mientras que HEAD~123 va 123 commits hacia atrás desde donde estamos ahora.

También podemos referirnos a los commits usando esas largas cadenas de dígitos y letras que git log despliega. Estos son IDs únicos para los cambios, y aquí “únicos” realmente significa únicos: cada cambio a cualquier conjunto de archivos en cualquier computadora tiene un identificador único de 40 caracteres. Nuestro primer commit recibió el ID f22b25e3233b4645dabd0d81e651fe074bd8e73b, así que probemos esto:

$ git diff f22b25e3233b4645dabd0d81e651fe074bd8e73b mars.txt
diff --git a/mars.txt b/mars.txt
index df0654a..93a3e13 100644
--- a/mars.txt
+++ b/mars.txt
@@ -1 +1,4 @@
 Cold and dry, but everything is my favorite color
+The two moons may be a problem for Wolfman
+But the Mummy will appreciate the lack of humidity

Esa es la respuesta correcta, pero escribir cadenas aleatorias de 40 caracteres es molesto, entonces Git nos permite usar solo los primeros caracteres:

$ git diff f22b25e mars.txt
diff --git a/mars.txt b/mars.txt
index df0654a..93a3e13 100644
--- a/mars.txt
+++ b/mars.txt
@@ -1 +1,4 @@
 Cold and dry, but everything is my favorite color
+The two moons may be a problem for Wolfman
+But the Mummy will appreciate the lack of humidity

¡Todo bien! Asi que podemos guardar cambios en los archivos y ver qué hemos cambiado —ahora ¿Cómo podemos restaurar versiones anteriores de las cosas? Supongamos que accidentalmente sobrescribimos nuestro archivo:

$ nano mars.txt
$ cat mars.txt
We will need to manufacture our own oxygen

git status ahora nos dice que el archivo ha sido cambiado, pero esos cambios no se han organizado:

$ git status
On branch master
Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git checkout -- <file>..." to discard changes in working directory)

\tmodified:   mars.txt

no changes added to commit (use "git add" and/or "git commit -a")

Podemos volver a poner las cosas tal como estaban usando git checkout:

$ git checkout HEAD mars.txt
$ cat mars.txt
Cold and dry, but everything is my favorite color
The two moons may be a problem for Wolfman
But the Mummy will appreciate the lack of humidity

Como puedes adivinar por su nombre, git checkout recupera (es decir, restaura) una versión anterior de un archivo. En este caso, le estamos diciendo a Git que queremos recuperar la versión del archivo grabado en HEAD, que es el último commit guardado. Si queremos volver más allá, podemos usar un identificador de commit en su lugar:

$ git checkout f22b25e mars.txt
$ cat mars.txt
Cold and dry, but everything is my favorite color
$ git status
# On branch master
Changes to be committed:
  (use "git reset HEAD <file>..." to unstage)
# Changes not staged for commit:
#   (use "git add <file>..." to update what will be committed)
#   (use "git checkout -- <file>..." to discard changes in working directory)
#
#\tmodified:   mars.txt
#
no changes added to commit (use "git add" and/or "git commit -a")

Ten en cuenta que los cambios están en el staging area de almacenamiento. Nuevamente, podemos volver a poner las cosas tal como estaban usando git checkout:

$ git checkout -f master mars.txt

No pierdas tu HEAD

Arriba usamos

$ git checkout f22b25e mars.txt

para revertir mars.txt a su estado después del commit f22b25e. Pero ¡Ten cuidado! El comando checkout tiene otras funcionalidades importantes y Git puede malinterpretar tus intenciones si no sos precisa a la hora de tipear. Por ejemplo, si olvidas mars.txt en ese comando, Git te dirá que “You are in ‘detached HEAD’ state”. En este estado, no deberías hacer ningún cambio. Puedes arreglar esto volviendo a conectar tu head usando git checkout master

Es importante recordar que debemos usar el número de commit que identifica el estado del repositorio antes del cambio que intentamos deshacer. Un error común es usar el número de commit en el cual hicimos el cambio del cual nos estamos tratando de deshacer. En el siguiente ejemplo, queremos recuperar el estado antes del más reciente commit (HEAD~1), que es commit f22b25e:

Git Checkout

Así que, para poner todo junto, aqui esta como Git trabaja, en forma de dibujo:

https://figshare.com/articles/How_Git_works_a_cartoon/1328266

Simplificando el caso común

Si lees el output de git status detenidamente, verás que incluye esta sugerencia:

(use "git checkout -- <file>..." to discard changes in working directory)

Como deciamos, git checkout sin un identificador de versión restaura los archivos al estado guardado en HEAD. El doble guión -- es necesario para separar los nombres de los archivos que se están recuperando del comando mismo: sin esto, Git intentaría usar el nombre del archivo como el identificador del commit.

El hecho de que los archivos puedan revertirse uno por uno tiende a cambiar la forma en que las personas organizan su trabajo. Si todo está en un documento grande, es difícil (pero no imposible) deshacer cambios a la introducción sin deshacer los cambios posteriores a la conclusión. Si la introducción y la conclusión se almacenan en archivos separados, por otra parte, retroceder y avanzar en el tiempo se vuelve mucho más fácil.

Recuperando versiones anteriores de un archivo

Jennifer ha realizado cambios en el script de Python en el que ha estado trabajando durante semanas, y las modificaciones que hizo esta mañana “corrompieron” el script y ya no funciona. Ella ha pasado ~ 1hr tratando de solucionarlo, sin tener suerte…

Por suerte, ¡Ella ha estado haciendo un seguimiento de las versiones de su proyecto usando Git! ¿Cuáles comandos le permitirán recuperar la última versión estable de su script Python llamado data_cruncher.py?

  1. $ git checkout HEAD

  2. $ git checkout HEAD data_cruncher.py

  3. $ git checkout HEAD~1 data_cruncher.py

  4. $ git checkout <unique ID of last commit> data_cruncher.py

  5. Ambos 2 y 4

Revertir un commit

Jennifer está colaborando en su script de Python con sus colegas y se da cuenta que su último commit en el repositorio del grupo es incorrecto y quiere deshacerlo. Jennifer necesita deshacer correctamente para que todos en el repositorio del grupo tengan el cambio correcto. git revert [ID de commit incorrecto] hará un nuevo commit que va a deshacer el commit anterior erroneo de Jennifer. Por lo tanto, git revert es diferente de git checkout [commit ID] porque checkout es para cambios locales no comprometidos con el repositorio de grupo. A continuación se encuentran los pasos correctos y explicaciones para que Jennifer use git revert, ¿Cuál es el comando que falta?

  1. ____ # Mira el historial de git del proyecto para encontrar el ID del commit

  2. Copia el ID (los primeros caracteres del ID, por ejemplo 0b1d055).

  3. git revert [commit ID]

  4. Escriba el nuevo mensaje del commit.

  5. Salva y cierra

Entendiendo Workflow y History

¿Cuál es el output de cat venus.txt al final de este conjunto de comandos?

$ cd planets
$ nano venus.txt #captura el siguiente texto: Venus is beautiful and full of love
$ git add venus.txt
$ nano venus.txt #agrega el siguiente texto: Venus is too hot to be suitable as a base
$ git commit -m "Comment on Venus as an unsuitable base"
$ git checkout HEAD venus.txt
$ cat venus.txt #esto imprimirá el contenido de venus.txt en la pantalla

1.

Venus is too hot to be suitable as a base

2.

Venus is beautiful and full of love

3.

Venus is beautiful and full of love
Venus is too hot to be suitable as a base

4.

Error because you have changed venus.txt without committing the changes

Solución

The answer is 2 because git add venus.txt was used only before add the line Venus is too hot to be suitable as a base which was lost when git checkout was executed. Using the flag -a with git commit would have prevented the lost.

Comprobando lo que entendiste de git diff

Considera este comando: git diff HEAD~3 mars.txt. ¿Qué predices que hará este comando si lo ejecutas? ¿Qué sucede cuando lo ejecutas? ¿Por qué?

Prueba éste otro comando, git diff [ID] mars.txt, donde [ID] es el identificador único para tu commit más reciente. ¿Qué piensas tú que sucederá, y qué es lo que pasa?

Deshacer los cambios almacenados

git checkout puede usarse para restaurar un commit anterior cuando cambios no marcados se han hecho, pero ¿También funcionará para los cambios que se han marcado pero no se han vuelto commit? Haz un cambio a mars.txt, agrega el cambio y usa git checkout para ver si puedes eliminar tu cambio.

Explorar y resumir el History

Explorar el history es una parte importante de git, a menudo es un desafío encontrar el ID de confirmación correcto, especialmente si el commit es de hace varios meses.

Imagina que el proyecto planets tiene más de 50 archivos. Deseas encontrar un commit con texto específico en mars.txt. Cuando escribes git log, aparece una lista muy larga, ¿Cómo puede restringir la búsqueda?

Recuerda que el comando git diff nos permite explorar un archivo específico, por ejemplo git diff mars.txt. Podemos aplicar una idea similar aquí.

$ git log mars.txt

Desafortunadamente, algunos de estos mensajes en los commits son muy ambiguos, por ejemplo update files. ¿Cómo puedes buscar a través de estos archivos?

Tanto git diff como git log son muy útiles y resumen una parte diferente del history para ti. ¿Es posible combinar ambos? Vamos a intentar lo siguiente:

$ git log --patch mars.txt

Deberías obtener una larga lista de output, y deberías poder ver tanto los dos mensajes del commit como la diferencia entre cada commit.

Pregunta: ¿Qué hace el siguiente comando?

$ git log --patch HEAD~3 *.txt

Puntos Clave

  • git diff despliega diferencias entre commits.

  • git checkout recupera versiones anteriores de archivos.