AirJD 焦点
AirJD

没有录音文件
00:00/00:00
加收藏

GO在纽约时报的应用实践[英, Using Go at The New York Times]

发布者 golang
发布于 1431734152378  浏览 7419 关键词 English, Go 
分享到

第1页

Go @nytimes.com

JP Robinson

@NYTDevs | developers.nytimes.com



第2页

About JP

● Sr Software Engineer ● email and alert platforms ● Writing Go for about 2 yrs ● github.com/jprobinson ● @jprbnsn

@NYTDevs | developers.nytimes.com



第3页

Go @ NYT

● Paperboy ● Before Go ● Our first Go application ● Writing bad Go and learning ● Replacing legacy code with Go ● Testing, building, deploying and monitoring ● Other teams and Go

@NYTDevs | developers.nytimes.com



第4页

Paperboy - NYT’s Email Platform

● Est. 2002 ● 40+ newsletters ● Transactional emails ● 3-15 Million emails/day ● ~2.5 Billion emails/year ● Breaking News Alert

○ sends ~1.3 Million unique emails in ~10 mins

● Today’s Headlines

○ ~2.2 million emails every morning @NYTDevs | developers.nytimes.com



第5页

Paperboy’s Services

● Campaign management

○ audience + template + schedule ○ A/B Testing

● Audience management

○ drag-drop user segmentation tool ○ demographic, subscription, behavior data

● Template management

○ WYSIWYG template editor

● Reporting

○ delivery, clicks & opens ○ Charts, Geo click maps, click heat maps

@NYTDevs | developers.nytimes.com



第6页

Before Go

@NYTDevs | developers.nytimes.com



第7页

Brian Seitz



● Smart man ● Introduced me to Go ● Launched first Go

production process ● Writes Go for enigma.

io now



@NYTDevs | developers.nytimes.com



第8页

He left his Gophers!

@NYTDevs | developers.nytimes.com



第9页

recpull

● 1st production Go process ● Small and simple ● No database connections

○ Picks up file of IDs ○ Hit Recommendation Engine API ○ Drops files on NFS

● Static binary made it easy to sneak into prod ● Most didn’t know, those who did didn’t mind

@NYTDevs | developers.nytimes.com



第10页

Writing Go

● My first commit

○ set up GOPATH ○ git clone ○ - fmt.Sprint ○ + fmt.Sprintf ○ go run main.go ○ git commit/push ○ put it on the resume!

● Decided to try it out in my free time

○ Read from DB, hit API ○ Serve API, write files to disk

@NYTDevs | developers.nytimes.com



第11页

Writing Bad Go

● How to not use goroutines:

○ Oprah-style with goroutines ○ ‘too many open files’! ○ Learn to pool goroutines ○ channels of channels

● How to not use database/sql

○ Oprah-style with *sql.DB ○ RTFM http://golang.org/pkg/database/sql/#DB

● Benchmarks looked good (5-7x PHP)

@NYTDevs | developers.nytimes.com



第12页

PowerMTA and Paperboy

● MTA servers

○ connect to Email Service Providers

○ queue/throttle/retry by domain

● .csv accounting files

○ who, what, when ○ delivery/bounce response

● TODO

○ bounce management ○ archiving ○ reporting

@NYTDevs | developers.nytimes.com



第13页

An Opportunity for Go

@NYTDevs | developers.nytimes.com



第14页

PMTA Problems

● 3 languages ● Logic duplicated in Java & Python ● Only 1 server can run processes at a time ● Lots of state ● Files ‘processing’ for hours ● Lots of files to deploy and manage ● Problem? wipe data and reload

@NYTDevs | developers.nytimes.com



第15页

A Go Solution

@NYTDevs | developers.nytimes.com



第16页

pmta-service

@NYTDevs | developers.nytimes.com



第17页

pmta-service pros

● Simple deployment ● goroutines

○ Easily fit several small tasks into 1 binary ○ concurrency FTW

● Reused logic for EMR ● Smarter archival management ● Distributed processing ● Testing

@NYTDevs | developers.nytimes.com



第18页

My Alerts and the Newstracker

● nytimes.com/myalerts ● Free article notification service ● Follow Times Topics, Orgs & key phrases ● Started in 2002 (before Google Alerts!) ● Originally paid service, free since 2008 ● ~85 million emails/year ● ~150 million article links/year

@NYTDevs | developers.nytimes.com



第19页

My Alerts

@NYTDevs | developers.nytimes.com



第20页

My Alerts

@NYTDevs | developers.nytimes.com



第21页

Another Opportunity for Go

@NYTDevs | developers.nytimes.com



第22页

Newstracker Problems

● 3 languages ● Duplicated data structures ● Lots of cron coordination ● Only one server can run at a time ● Slow

@NYTDevs | developers.nytimes.com



第23页

A Go Solution

@NYTDevs | developers.nytimes.com



第24页

newstrackerd pros

● Simple deployment ● goroutines ● Shared structs ● Distributed processing ● Speed ● Testing

@NYTDevs | developers.nytimes.com



第25页

Tools for Enterprise Adoption

● Build management

○ working with Hudson/Jenkins ○ test coverage reports ○ rpmbuild, rhnpush

● Service management

○ init.d & Puppet

● Deployment

○ yum, Puppet, Monit & Slack

● Monitoring

○ log, logrus, go-metrics, Graphite, Grafana

@NYTDevs | developers.nytimes.com



第26页

Testing and Building

● Jenkins/Hudson jobs ● poll Github repo and NYT dependencies ● go-testcover

○ runs go test, lint & vet over entire repo ○ if no tests, drop a blank_test.go ○ using t-yuki/gocover-cobertura ○ should switch to axw/gocov ○ push progress to Slack

● auto-deploy in dev and staging

@NYTDevs | developers.nytimes.com



第27页

Testing and Building

@NYTDevs | developers.nytimes.com



第28页

Test Artifacts

@NYTDevs | developers.nytimes.com



第29页

Test Artifacts

@NYTDevs | developers.nytimes.com



第30页

Building RPMs

@NYTDevs | developers.nytimes.com



第31页

Service Management

● init.d bash script

○ check/drop pid file ○ runs as system user, sets up env variables ○ redirects stderr to error.log for panic stack traces

[paperboy-profileapi01 ~]# service paperboy-profile-api status paperboy-profile-api is running…

[paperboy-profileapi01 ~]# service paperboy-profile-api stop paperboy-profile-api stopped

[paperboy-profileapi01 ~]# service paperboy-profile-api status paperboy-profile-api is not running

[paperboy-profileapi01 ~]# service paperboy-profile-api start paperboy-profile-api started

@NYTDevs | developers.nytimes.com



第32页

Service Management

● puppet services

○ puppet agent - no daemon ○ On package update, Puppet initiates a restart

@NYTDevs | developers.nytimes.com



第33页

Deployment

● EC2

○ ephemeral ○ provision with puppet and run ○ remove old boxes from LB and terminate

● NYT Data Centers

○ persistent ○ remove, update, add, carry on

● Puppet agent to start ● Monit to finish (in NYT) ● Slack along the way

@NYTDevs | developers.nytimes.com



第34页

Monitoring



● Most use “log”



● rcrowley/go-metrics



○ rcrowley/go-tigertonic/metrics.go



○ Timers, status and panic counters for APIs



○ goroutine counters



○ Memory, CPU usage



● Graphite and Grafana



● Sirupsen/logrus



● Looking at Sumo Logic



● Nagios



● Monit



@NYTDevs | developers.nytimes.com



第35页

Paperboy’s Tech Today

@NYTDevs | developers.nytimes.com



第36页

Go and Paperboy So Far

● 4 EMR streaming jobs ● 3 JSON API server stacks ● 2 Report aggregation services ● Transactional email RPC server ● Bulk email scheduler daemon ● My Alerts backend daemon ● Following (beta) backend daemon ● Behavior based audience service ● Email confirmation service

@NYTDevs | developers.nytimes.com



第37页

Paperboy’s Tech Tomorrow

@NYTDevs | developers.nytimes.com



第38页

Other Teams Using Go

● R&D (github.com/nytlabs) ● Interactive News (github.com/newsdev) ● NYT Now (github.com/nytimes) ● NYT Mobile ● Comments ● Messaging ● Data Universe ● Games ● Recommendation Engine ● Registration Services

@NYTDevs | developers.nytimes.com



第39页

Research & Development

● github.com/nytlabs ● streamtools (st-core)

○ Explore, analyse, modify and learn from streams of data

● Hive

○ A platform for backing crowdsourcing websites, built in golang for elasticsearch

● Tick

○ An application that tracks characteristics of data-streams over time.

● Colony

○ A lightweight microservice framework for NSQ

@NYTDevs | developers.nytimes.com



第40页

Interactive News

● DevOps ● github.com/newsdev ● Context

○ Securely stores and conveniently retrieves environment variables in etcd or Redis

● Promise

○ An active HTTP reverse-proxy backed by etcd

● longshore

○ build server for docker

@NYTDevs | developers.nytimes.com



第41页

NYT Mobile

● Samizdat

○ Scala ○ Bundles requests for mobile apps ○ Tested with custom Go benchmarking tool

■ uses go-metrics

@NYTDevs | developers.nytimes.com



第42页

NYT Now

● github.com/nytimes/gziphandler ● m9t

○ serves custom fields to app ○ takes big JSON, makes little JSON

@NYTDevs | developers.nytimes.com



第43页

Comments

● Working on a complete API rewrite

@NYTDevs | developers.nytimes.com



第44页

Messaging

● New development in Go ● Writing push notification processors

@NYTDevs | developers.nytimes.com



第45页

Games

● Preparing ourselves for a complete rewrite of the Games API using Go

● Real time leaderboards, multiplayer collaborative puzzles, content APIs, in-app purchase support...

@NYTDevs | developers.nytimes.com



第46页

Data Universe

● Movies API ● Looking to migrate existing APIs from PHP

@NYTDevs | developers.nytimes.com



第47页

Rec Engine, Registration

● Eyeing Go for upcoming projects

○ api for whitelisting experiments ○ reporting/dashboards ○ data collection, aggregation and filtering ○ infrastructure and monitoring

● mainly APIs but also messaging

@NYTDevs | developers.nytimes.com



第48页

Why Go @ NYT?

● Deployment ● Concurrency ● Testing ● Performance ● Fun

@NYTDevs | developers.nytimes.com



第49页

Thanks!



Questions?



@NYTDevs | developers.nytimes.com



第50页

We’re Hiring!

developers.nytimes.com/careers

@NYTDevs | developers.nytimes.com



支持文件格式:*.pdf
上传最后阶段需要进行在线转换,可能需要1~2分钟,请耐心等待。