1.云原生语境下,监控告警和Events/Metrics/Tracing可以全都用Prometheus全家桶实现么?那应该是怎样一种架构?
- open telemetry,不只是 prometheus
2.事件中心(事件收集/上报/pipeline回调)目前开源有没有什么现成方案?不是metrics就是事件中心,譬如各种各样的事件,譬如说告警事件,磁盘异常事件,发布事件等等,可以tps://www.infoq.cn/article/ou*jol5q34mqllcchold
- event collect –> producer
- message queue
- consumer -> adapter, workflow(argo)
3.虽然服务无状态, 但是如何才能让同一个用户只访问同一台服务器呢?(session或者网关那里根据某些字段定向)
4.没太理解事件流是啥概念,日志不也是事件驱动的嘛
- !导入失败
- 《stream processing with apache flink》
- 《streaming systems》
- millwheel,dataflow,streaming 101 <- 《streaming systems》的前身
- apache beam,flink,spark
- 《one sql to rule them all》paper
- awesome streaming
- lambda/kappa 架构
5.请问有没有一些资料合集是讲Go语言从物理机上容器遇到的奇怪问题的?
- 我也不知道
6.weibo在遇到大流量的时候为啥还会经常挂呢?不应该有弹性扩缩容这种的嘛?
- (扩容也需要时间,估计还没来得扩就被怼挂了)
- 崩的是在评论系统,mysql 的写入量太高(2020 双 11 支付宝的支付峰值是 58.3w)
- 写入的单热点问题不太好解决
7.ES我看新版支持 SQL 查询, SQL 查询看起来用得不多,是不好吗?和之前的查询方式有什么区别吗?
- es SQL 是 6.0 才出的,大家还没普遍接受呢
- 第二公司内的 es 集群还没那么快就升到这么新的版本呢
- SQL 的功能并不是全集,有一些 DSL 里的没法实现
8.线上服务编译后运行的程序和pod一般是啥关系?
- 1pod == n container, 应用是在一个 container 里的
- 1pod = 你的应用的一个进程 + sidecar
9.大家在本地机器,怎么实践尝试集群的一些知识?(如:redis、mysql的集群之类的)用曹大刚刚说的 minikube 可以吗?
- 可以的
10.docker,k8s的源码 有必要研究一遍嘛 (有本书在讲,虽然不是最新版本的)
- 如果不是做 inf 或者 k8s 的岗位,研究 k8s 的代码收益不大
- k8s 现在也是几十万行代码的项目了
- 知道基本概念、使用、原理就可以了
11.Go写的Mesh遇到java的fgc会抖动是怎么解决的呢
- Go(mesh) —> java(app),pod
- Go –write data to–> java(fgc),走网络通信的,write buffer 就满了
- gopark,pprof 会看到很多阻塞的 goroutine ——> Go(mesh) OOM
- 本机的 write 也要加 timeout
12.k8s 集群类的有状态服务 该怎么部署呢? 类似 Hadoop, Elasticsearch 这种, master 节点 和 worker 需要互相访问到,使用statefulset 要对每一个worker 的 pod 都对应一个单独的 service吗 ??
- stateful set
- 节点亲和/pod反亲和性
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 lihuanjie113@gmail.com