卷曲下载 HTML 而不是实际的 Zip 文件? 这是做什么

卷曲 是一个很好的工具 在 Linux 终端下载文件.

下载与原始文件同名的文件的常用语法非常简单:

curl -O URL_of_the_file

这在大多数情况下都有效。 但是,您会注意到,有时当您从 GitHub 或 SourceForge 下载文件时,它不会获取正确的文件。

为了 example,我试图下载 tar gz 格式的 archinstall 脚本。 这些文件位于 发布页面.

如果我在浏览器中打开这个源代码链接,它会得到 .tar.gz 格式的源代码。

但是,如果我使用终端下载相同的文件 curl 命令,我得到一个不正确存档格式的小文件。

tar -zxvf v2.4.2.tar.gz 

gzip: stdin: not in gzip format
tar: Child returned status 1
tar: Error is not recoverable: exiting now

当我运行 file 命令以了解确切的文件类型时,它告诉我它是一个 HTML 文档。

file v2.4.2.tar.gz 
v2.4.2.tar.gz: HTML document, ASCII text, with no line terminators

HTML 文档而不是存档 zip 或 tarball? 问题出在哪里? 让我告诉你快速修复。

正确下载存档文件 curl

这里的问题是您拥有的 URL 重定向到实际的存档文件。 为此,您需要使用其他选项。

curl -JLO URL_of_the_file

选项可以按任何顺序排列。 记住 J LO(詹妮弗洛佩兹)更容易。

这是基于手册页的选项的快速说明 curl 命令。

  • J:此选项告诉 -O, –remote-name 选项使用服务器指定的 Content-Disposition 文件名,而不是从 URL 中提取文件名。
  • L:如果服务器报告请求的页面已移动到不同的位置(用 Location: 标头和 3XX 响应代码指示),此选项将使 curl 在新地方重做请求。
  • O:使用此选项,您无需指定下载的输出文件名。

正如您在下面的屏幕截图中看到的那样,这次我能够下载正确的文件 curl -JLO 选项。

额外提示:您需要登录吗?

这适用于公共文件。 但是,如果您尝试从私有存储库或 GitLab 下载文件,那么您可能会看到有关重定向到登录页面的消息。

<html><body>You are being <a href="https://gitlab.com/users/sign_in">redirected</a>.</body></html>

在这种情况下,请为 API 令牌提供 -H 选项。

我希望这个快速的小技巧可以帮助您正确地使用 Curl 下载存档文件。 如果您仍然遇到问题,请告诉我 curl 下载。