Add codename, retries, timeouts
This commit is contained in:
parent
3ba71a7787
commit
41c84c70f6
@ -1,17 +1,37 @@
|
|||||||
package snapshot
|
package snapshot
|
||||||
|
|
||||||
import (
|
import (
|
||||||
|
"bytes"
|
||||||
|
"compress/bzip2"
|
||||||
|
"compress/gzip"
|
||||||
|
"context"
|
||||||
"errors"
|
"errors"
|
||||||
"fmt"
|
"fmt"
|
||||||
|
"io"
|
||||||
|
"net/http"
|
||||||
"net/url"
|
"net/url"
|
||||||
|
"os"
|
||||||
"regexp"
|
"regexp"
|
||||||
"strings"
|
"strings"
|
||||||
|
"time"
|
||||||
|
|
||||||
|
"github.com/PuerkitoBio/goquery"
|
||||||
|
"github.com/rs/zerolog/log"
|
||||||
|
"github.com/ulikunitz/xz"
|
||||||
|
"golang.org/x/time/rate"
|
||||||
|
|
||||||
"code.dumpstack.io/tools/out-of-tree/distro/debian/snapshot/mr"
|
"code.dumpstack.io/tools/out-of-tree/distro/debian/snapshot/mr"
|
||||||
)
|
)
|
||||||
|
|
||||||
const URL = "https://snapshot.debian.org"
|
const URL = "https://snapshot.debian.org"
|
||||||
|
|
||||||
|
var Limiter = rate.NewLimiter(rate.Every(time.Second), 1)
|
||||||
|
|
||||||
|
// Retries in case of 5xx errors
|
||||||
|
var Retries = 10
|
||||||
|
|
||||||
|
var HttpTimeout = time.Second * 5
|
||||||
|
|
||||||
func SourcePackageVersions(name string) (versions []string, err error) {
|
func SourcePackageVersions(name string) (versions []string, err error) {
|
||||||
pkg, err := mr.GetPackage(name)
|
pkg, err := mr.GetPackage(name)
|
||||||
if err != nil {
|
if err != nil {
|
||||||
@ -40,6 +60,7 @@ type Package struct {
|
|||||||
Snapshot string
|
Snapshot string
|
||||||
Archive string
|
Archive string
|
||||||
|
|
||||||
|
Codename string
|
||||||
Component string
|
Component string
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
@ -78,6 +99,11 @@ func NewPackage(name, srcname, version, arch string) (p Package, err error) {
|
|||||||
}
|
}
|
||||||
p.Repo.Component = split[2]
|
p.Repo.Component = split[2]
|
||||||
|
|
||||||
|
p.Repo.Codename, err = p.getCodename()
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
return
|
return
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -94,7 +120,157 @@ func (p Package) getHash() (hash string, err error) {
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
err = errors.New("not found")
|
err = errors.New("hash not found")
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p Package) getCodename() (dist string, err error) {
|
||||||
|
dists, err := p.dists()
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
for _, dist = range dists {
|
||||||
|
var distHasPackage bool
|
||||||
|
distHasPackage, err = p.isDistHasPackage(dist)
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
if distHasPackage {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
err = errors.New("codename not found")
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p Package) dists() (dists []string, err error) {
|
||||||
|
query, err := url.JoinPath(URL, "archive", p.Repo.Archive,
|
||||||
|
p.Repo.Snapshot, "dists/")
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
resp, err := httpGetWithRetry(query)
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
defer resp.Body.Close()
|
||||||
|
|
||||||
|
if resp.StatusCode != 200 {
|
||||||
|
err = fmt.Errorf("%d (%s)", resp.StatusCode, query)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
doc, err := goquery.NewDocumentFromReader(resp.Body)
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
doc.Find("table tr").Each(func(i int, s *goquery.Selection) {
|
||||||
|
html, err := s.Html()
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
if !strings.Contains(html, "<td>d</td") {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
s.Find("a").Each(func(i int, s *goquery.Selection) {
|
||||||
|
if strings.Contains(s.Text(), "..") {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
dist := strings.Replace(s.Text(), "/", "", -1)
|
||||||
|
dists = append(dists, dist)
|
||||||
|
})
|
||||||
|
})
|
||||||
|
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p Package) isDistHasPackage(dist string) (yes bool, err error) {
|
||||||
|
var buf []byte
|
||||||
|
for _, ext := range []string{"xz", "gz", "bz2"} {
|
||||||
|
buf, err = p.distPackage(dist, ext)
|
||||||
|
if err == nil {
|
||||||
|
break
|
||||||
|
}
|
||||||
|
}
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
yes = bytes.Contains(buf, []byte(p.Deb.Name))
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p Package) distPackage(dist string, ext string) (buf []byte, err error) {
|
||||||
|
query, err := url.JoinPath(URL, "archive", p.Repo.Archive,
|
||||||
|
p.Repo.Snapshot, "dists", dist,
|
||||||
|
fmt.Sprintf("main/binary-%s/Packages.%s", p.Arch, ext),
|
||||||
|
)
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
resp, err := httpGetWithRetry(query)
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
defer resp.Body.Close()
|
||||||
|
|
||||||
|
var reader io.Reader
|
||||||
|
switch ext {
|
||||||
|
case "xz":
|
||||||
|
reader, err = xz.NewReader(resp.Body)
|
||||||
|
case "gz":
|
||||||
|
reader, err = gzip.NewReader(resp.Body)
|
||||||
|
case "bz2":
|
||||||
|
reader = bzip2.NewReader(resp.Body)
|
||||||
|
default:
|
||||||
|
err = fmt.Errorf("%s not supported", ext)
|
||||||
|
}
|
||||||
|
if err != nil {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
buf, err = io.ReadAll(reader)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
func httpGetWithRetry(query string) (resp *http.Response, err error) {
|
||||||
|
flog := log.With().Str("url", query).Logger()
|
||||||
|
for i := Retries; i > 0; i-- {
|
||||||
|
flog.Trace().Msg("wait")
|
||||||
|
Limiter.Wait(context.Background())
|
||||||
|
|
||||||
|
client := http.Client{Timeout: HttpTimeout}
|
||||||
|
|
||||||
|
flog.Trace().Msg("start")
|
||||||
|
resp, err = client.Get(query)
|
||||||
|
if err != nil {
|
||||||
|
if os.IsTimeout(err) {
|
||||||
|
flog.Debug().Msgf("timeout; retry (%d left)", i)
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
flog.Error().Err(err).Msg("")
|
||||||
|
return
|
||||||
|
}
|
||||||
|
flog.Debug().Msgf("%s", resp.Status)
|
||||||
|
|
||||||
|
if resp.StatusCode < 500 {
|
||||||
|
break
|
||||||
|
}
|
||||||
|
|
||||||
|
resp.Body.Close()
|
||||||
|
flog.Debug().Msgf("retry (%d left)", i)
|
||||||
|
}
|
||||||
|
|
||||||
|
if resp.StatusCode >= 400 {
|
||||||
|
err = fmt.Errorf("%d (%s)", resp.StatusCode, query)
|
||||||
|
}
|
||||||
return
|
return
|
||||||
}
|
}
|
||||||
|
|
||||||
|
Loading…
Reference in New Issue
Block a user