18.cloud native go

曹大讲课问题记录

发布时间 : 2024-02-28 15:55

阅读 :

1.云原生语境下，监控告警和Events/Metrics/Tracing可以全都用Prometheus全家桶实现么？那应该是怎样一种架构？
2.事件中心(事件收集/上报/pipeline回调)目前开源有没有什么现成方案？不是metrics就是事件中心，譬如各种各样的事件，譬如说告警事件，磁盘异常事件，发布事件等等，可以tps://www.infoq.cn/article/ou*jol5q34mqllcchold
3.虽然服务无状态，但是如何才能让同一个用户只访问同一台服务器呢？（session或者网关那里根据某些字段定向）
4.没太理解事件流是啥概念，日志不也是事件驱动的嘛
5.请问有没有一些资料合集是讲Go语言从物理机上容器遇到的奇怪问题的？
6.weibo在遇到大流量的时候为啥还会经常挂呢？不应该有弹性扩缩容这种的嘛？
7.ES我看新版支持 SQL 查询， SQL 查询看起来用得不多，是不好吗？和之前的查询方式有什么区别吗？
8.线上服务编译后运行的程序和pod一般是啥关系？
9.大家在本地机器，怎么实践尝试集群的一些知识？（如：redis、mysql的集群之类的）用曹大刚刚说的 minikube 可以吗？
10.docker,k8s的源码有必要研究一遍嘛 (有本书在讲，虽然不是最新版本的)
11.Go写的Mesh遇到java的fgc会抖动是怎么解决的呢
12.k8s 集群类的有状态服务该怎么部署呢？类似 Hadoop， Elasticsearch 这种， master 节点和 worker 需要互相访问到，使用statefulset 要对每一个worker 的 pod 都对应一个单独的 service吗？？

1.云原生语境下，监控告警和Events/Metrics/Tracing可以全都用Prometheus全家桶实现么？那应该是怎样一种架构？

open telemetry，不只是 prometheus

2.事件中心(事件收集/上报/pipeline回调)目前开源有没有什么现成方案？不是metrics就是事件中心，譬如各种各样的事件，譬如说告警事件，磁盘异常事件，发布事件等等，可以tps://www.infoq.cn/article/ou*jol5q34mqllcchold

event collect –> producer
message queue
consumer -> adapter, workflow(argo)

3.虽然服务无状态，但是如何才能让同一个用户只访问同一台服务器呢？（session或者网关那里根据某些字段定向）

https://www.google.com.hk/search?q=stiky+session&newwindow=1&source=hp&ei=-0EqYe3jArzfmAXnm4u4Bw&iflsig=ALs-wAMAAAAAYSpQC36AMS5fQL8myd0Yf32AiIJL7phy&oq=stiky+session&gs_lcp=Cgdnd3Mtd2l6EAMyBAgAEA0yBAgAEA0yBAgAEA0yBAgAEA0yBAgAEA0yBAgAEA0yBAgAEA0yBAgAEA0yBAgAEA0yBAgAEA06BQgAEIAEOgQIABBDOgQIABAKOgcIABCABBAKOgcIABCABBAMOgYIABAKEBM6CggAEAwQChAeEBM6BggAEB4QEzoICAAQDBAeEBM6CggAEAgQChAeEBM6CAgAEAgQHhATOgwIABAMEAUQChAeEBM6CggAEAUQChAeEBM6BggAEA0QHjoGCAAQChAeOggIABANEAoQHlCSAVj6FmD7F2gCcAB4AIABvgGIAf8SkgEEMC4xNJgBAKABAQ&sclient=gws-wiz&ved=0ahUKEwitzaPq8NPyAhW8L6YKHefNAncQ4dUDCAc&uact=5

4.没太理解事件流是啥概念，日志不也是事件驱动的嘛

!导入失败
《stream processing with apache flink》
《streaming systems》
millwheel，dataflow，streaming 101 <- 《streaming systems》的前身
apache beam，flink，spark
《one sql to rule them all》paper
awesome streaming
lambda/kappa 架构

5.请问有没有一些资料合集是讲Go语言从物理机上容器遇到的奇怪问题的？

我也不知道

6.weibo在遇到大流量的时候为啥还会经常挂呢？不应该有弹性扩缩容这种的嘛？

（扩容也需要时间，估计还没来得扩就被怼挂了）
崩的是在评论系统，mysql 的写入量太高(2020 双 11 支付宝的支付峰值是 58.3w)
写入的单热点问题不太好解决

7.ES我看新版支持 SQL 查询， SQL 查询看起来用得不多，是不好吗？和之前的查询方式有什么区别吗？

es SQL 是 6.0 才出的，大家还没普遍接受呢
第二公司内的 es 集群还没那么快就升到这么新的版本呢
SQL 的功能并不是全集，有一些 DSL 里的没法实现

8.线上服务编译后运行的程序和pod一般是啥关系？

1pod == n container, 应用是在一个 container 里的
1pod = 你的应用的一个进程 + sidecar

9.大家在本地机器，怎么实践尝试集群的一些知识？（如：redis、mysql的集群之类的）用曹大刚刚说的 minikube 可以吗？

可以的

10.docker,k8s的源码有必要研究一遍嘛 (有本书在讲，虽然不是最新版本的)

如果不是做 inf 或者 k8s 的岗位，研究 k8s 的代码收益不大
k8s 现在也是几十万行代码的项目了
知道基本概念、使用、原理就可以了

11.Go写的Mesh遇到java的fgc会抖动是怎么解决的呢

Go(mesh) —> java(app)，pod
Go –write data to–> java(fgc)，走网络通信的，write buffer 就满了
gopark，pprof 会看到很多阻塞的 goroutine ——> Go(mesh) OOM
本机的 write 也要加 timeout

12.k8s 集群类的有状态服务该怎么部署呢？类似 Hadoop， Elasticsearch 这种， master 节点和 worker 需要互相访问到，使用statefulset 要对每一个worker 的 pod 都对应一个单独的 service吗？？

stateful set
节点亲和/pod反亲和性

转载请注明来源，欢迎对文章中的引用来源进行考证，欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论，也可以邮件至 lihuanjie113@gmail.com

18.cloud native go

1.云原生语境下，监控告警和Events/Metrics/Tracing可以全都用Prometheus全家桶实现么？那应该是怎样一种架构？

2.事件中心(事件收集/上报/pipeline回调)目前开源有没有什么现成方案？不是metrics就是事件中心，譬如各种各样的事件，譬如说告警事件，磁盘异常事件，发布事件等等，可以tps://www.infoq.cn/article/ou*jol5q34mqllcchold

3.虽然服务无状态， 但是如何才能让同一个用户只访问同一台服务器呢？（session或者网关那里根据某些字段定向）

4.没太理解事件流是啥概念，日志不也是事件驱动的嘛

5.请问有没有一些资料合集是讲Go语言从物理机上容器遇到的奇怪问题的？

6.weibo在遇到大流量的时候为啥还会经常挂呢？不应该有弹性扩缩容这种的嘛？

7.ES我看新版支持 SQL 查询， SQL 查询看起来用得不多，是不好吗？和之前的查询方式有什么区别吗？

8.线上服务编译后运行的程序和pod一般是啥关系？

9.大家在本地机器，怎么实践尝试集群的一些知识？（如：redis、mysql的集群之类的）用曹大刚刚说的 minikube 可以吗？

10.docker,k8s的源码 有必要研究一遍嘛 (有本书在讲，虽然不是最新版本的)

11.Go写的Mesh遇到java的fgc会抖动是怎么解决的呢

12.k8s 集群类的有状态服务 该怎么部署呢？ 类似 Hadoop， Elasticsearch 这种， master 节点 和 worker 需要互相访问到，使用statefulset 要对每一个worker 的 pod 都对应一个单独的 service吗 ？？

3.虽然服务无状态，但是如何才能让同一个用户只访问同一台服务器呢？（session或者网关那里根据某些字段定向）

10.docker,k8s的源码有必要研究一遍嘛 (有本书在讲，虽然不是最新版本的)

12.k8s 集群类的有状态服务该怎么部署呢？类似 Hadoop， Elasticsearch 这种， master 节点和 worker 需要互相访问到，使用statefulset 要对每一个worker 的 pod 都对应一个单独的 service吗？？