这个帖子启发了我,让我再次开始寻找有没有办法把 Pornhub 的文件名 map 到视频 URL 上。
如上面所说,文件名的格式就是
{分辨率}_{码率}_{ID}.mp4 这个样子。但是 Pornhub 视频页面 URL 里的却是需要一个十六进制的 viewkey,而不是 ID。这两者的关系我怎么都弄不出来(是正相关,但并不是线性的),所以知道 ID 也没用。
不过(对于还没被 PH 删掉的视频)其实不难办。具体来说,一旦知道了视频的 ID,就可以制造一个 POST 请求发送到 https://www.pornhub.com/video/favourite 这个 API,把视频加到自己的 PH 收藏夹里。随便找了两个我电脑里的 Pornhub 视频文件名,测试了一下,确实是好使的。通过 Pornhub 下载下来的文件名反向找到 Pornhub 页面这个 general 的问题就解决了。
不过,对于楼主所发的 64715151 和 61102921 却没能成功,添加进收藏夹的 API call 成功了,但收藏夹里没有出现相应的视频。很大概率说明那两个视频已经被删除掉了。
此时,我发现万能的 Internet Archive 上有人把 2020 年 6 月时的 Pornhub metadata snapshot 打包为 CSV 可以下载(
地址)。从那个 CSV 里能够找到每个视频的 ID、viewkey、标题以及其它信息。在那个 CSV 里,可以看到 2015 年 12 月 27 日上传的很多个 ID 为 647151XX 的视频的信息,但并没有 64715151。同样,也并没有 61102921。就此可以确凿地推断,楼主提到的两个视频在 2020 年 6 月之前就已经被从 Pornhub 上删除掉了。