OpenI
/
prpc
mirror of https://github.com/4paradigm/prpc.git

 
			
							#include "RpcContext.h"

namespace paradigm4 {
namespace pico {
namespace core {

/*
 * 暂时LB的策略是random
 * 一个好一点做法是Dealer来要请求
 */

static inline uint64_t rpc_sid_pack(int rpc_id, int sid) {
    return rpc_id * 1000000007LL + sid;
}

void FairQueue::add_server(int sid) {
    //std::vector<RpcRequest> vec;
    //SCHECK(_sid2cache.emplace(sid, std::move(vec)).second);
    auto cache_que = std::make_unique<MpscQueue<RpcRequest>>();
    SCHECK(_sid2cache.emplace(sid, std::move(cache_que)).second);
}

void FairQueue::remove_server(int sid) {
    auto cit = _sid2cache.find(sid);
    SCHECK(cit != _sid2cache.end());
    RpcRequest req;
    if (cit->second->pop(req)) {
        SLOG(WARNING)
            << "remove server. Drop cached requests. "
            << " rpc_id is " << req.head().rpc_id
            << " sid is " << req.head().sid;
    }
    _sid2cache.erase(cit);
}

void FairQueue::add_server_dealer(int sid,
      Dealer* dealer) {
    auto it = _sid2dealers.find(sid);
    if (it == _sid2dealers.end()) {
        _sid2dealers.insert({sid, {dealer}});
    } else {
        it->second.push_back(dealer);
    }
    _sids.push_back(sid);
    auto cit = _sid2cache.find(sid);
    if (cit != _sid2cache.end()) {
        RpcRequest req;
        //add server dealer之前会加写锁，所以应该不会少pop
        while (cit->second->pop(req)) {
            dealer->push_request(std::move(req));
        }
    }
}

void FairQueue::remove_server_dealer(int sid,
      Dealer* dealer) {
    auto it = _sid2dealers.find(sid);
    SCHECK(it != _sid2dealers.end());
    auto& dealers = it->second;
    for (size_t i = 0; i < dealers.size(); ++i) {
        if (dealers[i] == dealer) {
            dealers[i] = std::move(dealers.back());
            dealers.pop_back();
        }
    }
    for (size_t i = 0; i < _sids.size(); ++i) {
        if (_sids[i] == sid) {
            _sids[i] = std::move(_sids.back());
            _sids.pop_back();
            break;
        }
    }
    if (it->second.empty()) {
        _sid2dealers.erase(it);
    }
}

bool FairQueue::empty() {
    return _sid2dealers.empty() && _sid2cache.empty();
}

Dealer* FairQueue::next() {
    SCHECK(!_sids.empty()) << "no server.";
    int sid = _sids[_sids_rr_index.fetch_add(1, std::memory_order_relaxed)
                    % _sids.size()];
    if (_sid2dealers.empty()) {
        return nullptr;
    } else {
        return next(sid);
    }
}

Dealer* FairQueue::next(int sid) {
    if (sid == -1) {
        if (_sids.empty()) {
            return nullptr;
        }
        sid = _sids[_sids_rr_index.fetch_add(1, std::memory_order_relaxed)
                    % _sids.size()];
    }
    auto it = _sid2dealers.find(sid);
    if (it == _sid2dealers.end()) {
        return nullptr;
    }
    auto& d = it->second;
    SCHECK(!d.empty()) << "no dealer.";
    size_t index =  _dealer_id_rr_index.load(std::memory_order_relaxed);
    index += 1;
    if (index >= d.size()) {
        index = 0;
    }
    _dealer_id_rr_index.store(index, std::memory_order_relaxed);
    return d[index];
}

bool FairQueue::push_request(int sid, RpcRequest&& req) {
    if (sid == -1) {
        if (_sid2cache.empty()) {
            return false;
        }
        if (_sids.empty()) {
            sid = _sid2cache.begin()->first;
        } else {
            sid = _sids[_sids_rr_index.fetch_add(1, std::memory_order_relaxed)
                % _sids.size()];
        }
    }
    auto it = _sid2dealers.find(sid);
    if (it != _sid2dealers.end()) {
        SCHECK(!it->second.empty()) << "no dealer.";
        it->second.back()->push_request(std::move(req));
        return true;
    }
    auto cit = _sid2cache.find(sid);
    if (cit != _sid2cache.end()) {
        cit->second->push(std::move(req));
        return true;
    }
    return false;
}

void RpcContext::initialize(bool is_use_rdma,
      comm_rank_t rank,
      int io_thread_num) {
    _self.global_rank = rank;
    _is_use_rdma = is_use_rdma;
    _io_thread_num = io_thread_num;
    for (int i = 0; i < io_thread_num; ++i) {
        _epfds.push_back(epoll_create1(EPOLL_CLOEXEC));
    }
    if (_is_use_rdma) {
#ifdef USE_RDMA
        _acceptor = std::make_unique<RdmaAcceptor>();
#else
        SLOG(FATAL) << "rdma not supported.";
#endif
    } else {
        _acceptor = std::make_unique<TcpAcceptor>();
    }
}

void RpcContext::finalize() {
    SLOG(INFO) << "join rpc async threads";
    while (_async_thread_num.load() > 0) {
        std::this_thread::yield();
    }
    SLOG(INFO) << "rpc async threads joined";
}

void RpcContext::async(std::function<void()> run) {
    _async_thread_num.fetch_add(1);
    std::thread th([this, run](){
        run();
        _async_thread_num.fetch_sub(1);
    });
    th.detach();
}
 
void RpcContext::bind(const std::string& ip, int backlog) {
    lock_guard<RWSpinLock> l(_spin_lock);
    PSCHECK(_acceptor->bind_on_random_port(ip) == 0);
    _self.endpoint = _acceptor->endpoint();
    PSCHECK(_acceptor->listen(backlog) == 0);
    add_event(_acceptor->fd(), _epfds[0], false);
    SLOG(INFO) << "bind success. endpoint is " << _acceptor->endpoint();
}

void RpcContext::begin_add_server() {
    _spin_lock.lock();
}

void RpcContext::end_add_server(int rpc_id, int sid) {
    auto it = _server_backend.find(rpc_id);
    if (it == _server_backend.end()) {
        std::tie(it, std::ignore)
              = _server_backend.emplace(rpc_id, std::make_shared<FairQueue>());
    }
    it->second->add_server(sid);
    _spin_lock.unlock();
}

void RpcContext::remove_server(int rpc_id, int sid) {
    lock_guard<RWSpinLock> l(_spin_lock);
    auto it = _server_backend.find(rpc_id);
    SCHECK(it != _server_backend.end()) << _server_backend.size();
    auto fq = it->second;
    fq->remove_server(sid);
    if (fq->empty()) {
        _server_backend.erase(it);
    }
}

void RpcContext::add_server_dealer(int rpc_id,
      int sid,
      Dealer* dealer) {
    lock_guard<RWSpinLock> l(_spin_lock);
    auto it = _server_backend.find(rpc_id);
    if (it == _server_backend.end()) {
        std::tie(it, std::ignore)
              = _server_backend.emplace(rpc_id, std::make_shared<FairQueue>());
    }
    it->second->add_server_dealer(sid, dealer);
}

void RpcContext::remove_server_dealer(int rpc_id,
      int sid,
      Dealer* dealer) {
    lock_guard<RWSpinLock> l(_spin_lock);
    auto it = _server_backend.find(rpc_id);
    SCHECK(it != _server_backend.end()) << _server_backend.size();
    auto fq = it->second;
    fq->remove_server_dealer(sid, dealer);
    if (fq->empty()) {
        _server_backend.erase(it);
    }
}

/*
 * thread safe
 */
void RpcContext::add_client_dealer(Dealer* dealer) {
    lock_guard<RWSpinLock> l(_spin_lock);
    _client_backend.emplace(dealer->id(), dealer);
}

/*
 * thread safe
 * finalize stub用的
 */
void RpcContext::remove_client_dealer(Dealer* dealer) {
    lock_guard<RWSpinLock> l(_spin_lock);
    _client_backend.erase(dealer->id());
}

void RpcContext::poll_wait(std::vector<epoll_event>& events,
      int tid,
      int timeout) {
    events.resize(_n_events.load(std::memory_order_acquire));
    int n = retry_eintr_call(
          ::epoll_wait, _epfds[tid], events.data(), events.size(), timeout);
    PSCHECK(n >= 0);
    events.resize(n);
}

std::shared_ptr<FrontEnd>* RpcContext::get_client_frontend_by_rank(
      comm_rank_t rank) {
    auto it = _client_sockets.find(rank);
    if (it == _client_sockets.end()) {
        SLOG(WARNING) << "no client frontend of rank " << rank;
        return nullptr;
    } else {
        if (it->second->available()) {
            return &it->second;
        } else {
            return nullptr;
        }
    }
}

/*
 * 这个msg只能是request
 */
comm_rank_t RpcContext::send_request(RpcMessage&& msg) {
    shared_lock_guard<RWSpinLock> l(_spin_lock);
    std::shared_ptr<FrontEnd>* f = nullptr;
    auto sid = msg.head()->sid;
    auto dest_rank = msg.head()->dest_rank;
    auto rpc_id = msg.head()->rpc_id;
    if (sid != -1) {
        f = get_client_frontend_by_sid(rpc_id, sid);
    } else if (dest_rank != -1) {
        f = get_client_frontend_by_rank(dest_rank);
    } else {
        f = get_client_frontend_by_rpc_id(rpc_id);
    }
    if (!f) {
        RpcResponse resp(*msg.head());
        resp.set_error_code(RpcErrorCodeType::ENOSUCHSERVER);
        push_response(std::move(resp));
        return -1;
    }
    comm_rank_t ret = (*f)->info().global_rank;
    
    if ((*f)->info() == _self) {
        push_request(std::move(msg));
        return ret;
    }
    (*f)->send_msg_nonblock(std::move(msg), *f);
    return ret;
}

void RpcContext::send_response(RpcMessage&& resp, bool nonblcok) {
    shared_lock_guard<RWSpinLock> l(_spin_lock);
    std::shared_ptr<FrontEnd>* f = nullptr;
    auto dest_rank = resp.head()->dest_rank;
    f = get_server_frontend_by_rank(dest_rank);
    if (!f) {
        SLOG(WARNING) << "no server frontend";
        return;
    }
    if ((*f)->state() & FRONTEND_DISCONNECT) {
        SLOG(WARNING) << "no server frontend";
        return;
    }

    if (nonblcok) {
        (*f)->send_msg_nonblock(std::move(resp), *f);
    } else {
        (*f)->send_msg(std::move(resp));
    }
}

std::shared_ptr<FrontEnd>* RpcContext::get_client_frontend_by_rpc_id(
      int rpc_id) {
    //shared_lock_guard<RWSpinLock> l(_spin_lock);
    auto it1 = _rpc_server_frontend.find(rpc_id);
    if (it1 == _rpc_server_frontend.end()) {
        return nullptr;
    }
    auto& v = it1->second;
    auto& ret = v[rand() % v.size()];
    if (ret->available()) {
        return &ret;
    }
    for (auto& i : v) {
        if (i->available()) {
            return &i;
        }
    }
    return nullptr;
}

std::shared_ptr<FrontEnd>* RpcContext::get_client_frontend_by_sid(int rpc_id,
      int server_id) {
    auto it = _rpc_server_id_frontend.find(rpc_sid_pack(rpc_id, server_id));
    if (it != _rpc_server_id_frontend.end()) {
        if (it->second->available()) {
            return &it->second;
        }
    }
    auto it1 = _rpc_server_info.find(rpc_id);
    if (it1 == _rpc_server_info.end()) {
        SLOG(WARNING) << "no rpc service " << rpc_id;
        return nullptr;
    }
    auto it2 = it1->second.find(server_id);
    if (it2 == it1->second.end()) {
        SLOG(WARNING) << "no rpc service server " << rpc_id << " " << server_id;
        return nullptr;
    }
    return get_client_frontend_by_rank(it2->second->global_rank);
}

std::shared_ptr<FrontEnd>* RpcContext::get_server_frontend_by_rank(
      comm_rank_t rank) {
    auto it = _server_sockets.find(rank);
    if (it == _server_sockets.end()) {
        return nullptr;
    } else {
        if (it->second->available()) {
            return &it->second;
        } else {
            return nullptr;
        }
    }
}

void RpcContext::handle_message_event(int fd) {
    auto func = [this](RpcMessage&& msg) {
        if (msg.head()->dest_dealer == -1) {
            push_request(RpcRequest(std::move(msg)));
        } else {
            push_response(RpcResponse(std::move(msg)));
        }
    };
    shared_lock_guard<RWSpinLock> l(_spin_lock);
    auto it = _fd_map.find(fd);
    if (it == _fd_map.end()) {
        SLOG(WARNING) << "no handle fd " << fd;
        return;
    }
    auto f = it->second;
    bool ret = f->handle_event(fd, func);
    if (!ret) {
        remove_frontend_event(f);
        f->set_state(FRONTEND_EPIPE);
        if (_to_del_client_sockets.count(f->info().global_rank)) {
            remove_frontend(f);
        }
    }
}

std::vector<CommInfo> RpcContext::get_comm_info() {
    shared_lock_guard<RWSpinLock> l(_spin_lock);
    std::vector<CommInfo> ret;
    ret.reserve(_server_sockets.size());
    for (auto& i : _server_sockets) {
        ret.push_back(i.second->info());
    }
    return ret;
}

void RpcContext::update_comm_info(const std::vector<CommInfo>& list, MasterClient* mc) {
    std::set<CommInfo> set(list.begin(), list.end());
    std::vector<std::shared_ptr<FrontEnd>> to_del;
    std::vector<CommInfo> to_add;
    lock_guard<RWSpinLock> l(_spin_lock);
    for (auto& i : _server_sockets) {
        auto& f = i.second;
        if (set.count(f->info()) == 0) {
            to_del.push_back(f);
        }
    }
    if (!to_del.empty()) {
        to_del.clear();
        std::vector<CommInfo> comm_info;
        auto ret = mc->get_comm_info(comm_info);
        if (!ret) {
            SLOG(WARNING) << "get comm info failed.";
        }
        set = std::set<CommInfo>(comm_info.begin(), comm_info.end());
        for (auto& i : _server_sockets) {
            auto& f = i.second;
            if (set.count(f->info()) == 0) {
                to_del.push_back(f);
            }
        }
    }
    for (auto& i : _client_sockets) {
        auto& f = i.second;
        if (set.count(f->info()) == 0) {
            to_del.push_back(f);
        }
    }
    for (auto ptr : to_del) {
        if (!ptr->available()) {
            remove_frontend(ptr.get());
        } else {
            _to_del_client_sockets.insert(ptr->info().global_rank);
        }
    }
    for (const auto& comm_info : list) {
        if (_client_sockets.count(comm_info.global_rank) == 0) {
            to_add.push_back(comm_info);
        }
    }
    for (const auto& comm_info : to_add) {
        auto f = std::make_shared<FrontEnd>();
        f->_ctx = this;
        f->_info = comm_info;
        f->is_client_socket() = true;
        f->_is_use_rdma = _is_use_rdma;
        _client_sockets.emplace(comm_info.global_rank, f);
    }
}

void RpcContext::update_service_info(const std::vector<RpcServiceInfo>& list) {
    {
        lock_guard<std::mutex> lk(_rpc_mu);
        lock_guard<RWSpinLock> l(_spin_lock);
        _rpc_info.clear();
        _rpc_server_info.clear();
        _rpc_server_frontend.clear();
        _rpc_server_id_frontend.clear();
        auto service_list = list;
        for (auto& service_info: service_list) {
            int num = 0;
            for (auto& server_info: service_info.servers) {
                if (_client_sockets.count(server_info.global_rank)) {
                    service_info.servers[num++] = server_info;
                }
            }
            service_info.servers.resize(num);
        }
        for (const auto& info : service_list) {
            _rpc_info.emplace(info.rpc_service_name, info);
        }
        for (const auto& pr : _rpc_info) {
            const auto& rpc_info = pr.second;
            for (const auto& server_info : rpc_info.servers) {
                _rpc_server_info[rpc_info.rpc_id][server_info.server_id]
                    = (ServerInfo*)&server_info;
                _rpc_server_frontend[rpc_info.rpc_id].push_back(
                      _client_sockets[server_info.global_rank]);
                SCHECK(_rpc_server_id_frontend.emplace(
                      rpc_sid_pack(rpc_info.rpc_id, server_info.server_id), 
                      _client_sockets[server_info.global_rank]).second);
            }
        }
        /* unique all frontend，但是觉得没必要
        for (auto& pr : _rpc_server_frontend) {
            auto& v = pr.second;
            std::sort(v.begin(), v.end());
            auto last = std::unique(v.begin(), v.end());
            v.erase(last, v.end());
        }*/
    }
    _rpc_waiter.notify_all(); // Allow send/receive threads to run.
}

void RpcContext::wait(const std::function<bool(RpcContext*)>& func) {
    std::unique_lock<std::mutex> lk(_rpc_mu); // RAII, no need for unlock.
    auto not_paused = [this, func]() { return func(this); };
    _rpc_waiter.wait(lk, not_paused);
}

void RpcContext::accept() {
    BinaryArchive ar;
    std::string info;
    auto f = std::make_shared<FrontEnd>();
    f->_ctx = this;
    f->_socket = _acceptor->accept();
    if (!f->_socket || !f->_socket->accept(info)) {
        return;
    }
    ar.set_read_buffer((char*)info.data(), info.size());
    CommInfo comm_info;
    uint16_t magic = -1;
    ar >> magic >> f->_info;
    SCHECK(magic == 0);
    ar.release();
    SLOG(INFO) << "accept from " << f->info();
    // 不async可能会导致同时互相connect时死锁
    async([this, f](){
        lock_guard<RWSpinLock> l(_spin_lock);
        f->_is_client_socket = false;
        comm_rank_t rank = f->info().global_rank;
        auto it = _server_sockets.find(rank);
        if (it != _server_sockets.end()) {
            remove_frontend(it->second.get());
        }
        _server_sockets.emplace(rank, f);
        add_frontend_event(f.get());
        f->set_state(FRONTEND_CONNECT);
    });
}

bool RpcContext::get_rpc_service_info(const std::string rpc_name,
      RpcServiceInfo& info) {
    shared_lock_guard<RWSpinLock> _(_spin_lock);
    auto it = _rpc_info.find(rpc_name);
    if (it == _rpc_info.end()) {
        return false;
    }
    info = it->second;
    return true;
}

bool RpcContext::get_avaliable_servers(const std::string& rpc_name,
      std::vector<int>& servers) {
    shared_lock_guard<RWSpinLock> _(_spin_lock);
    RpcServiceInfo info;
    auto it = _rpc_info.find(rpc_name);
    if (it == _rpc_info.end()) {
        return false;
    }
    info = it->second;
    for (auto& server : info.servers) {
        auto f = get_client_frontend_by_sid(info.rpc_id, server.server_id);
        if (f && (*f)->available()) {
            servers.push_back(server.server_id);
        }
    }
    return true;
}

/*
 * only for proxy
 * 假设外部已经抢到读锁
 */
void RpcContext::push_request(RpcRequest&& req) {
    int rpc_id = req.head().rpc_id;
    auto it = _server_backend.find(rpc_id);
    /// TODO: 如果没有找到server，那么先扔掉，后面想办法回复一个默认的resp
    if (it == _server_backend.end()) {
        SLOG(WARNING)
              << "recv request, but no such service. Drop it. "
              << " rpc_id is " << req.head().rpc_id
              << " sid is " << req.head().sid;
        return;
    }
    auto fq = it->second;
    auto dealer = fq->next(req.head().sid);
    if (!dealer) {
        if (!fq->push_request(req.head().sid, std::move(req))) {
            SLOG(WARNING)
                << "recv request, but no such server. Drop it. "
                << " rpc_id is " << req.head().rpc_id
                << " sid is " << req.head().sid;
        }
    } else {
        dealer->push_request(std::move(req));
    }
    
}

/*
 * 假设外部已经抢到读锁
 */
void RpcContext::push_response(RpcResponse&& resp) {
    auto it = _client_backend.find(resp.head().dest_dealer);
    if (it != _client_backend.end()) {
        auto dealer = it->second;
        if (dealer) {
            dealer->push_response(std::move(resp));
            return;
        }
    }
    SLOG(WARNING) << "recv resp, but dealer has been finalized. Drop it. "
          << resp.head();
}


// 必须在_spin_lock写锁中
void RpcContext::add_frontend_event(FrontEnd* f) {
    if (!f->_socket->fds().empty()) {
        static int idx = 0;
        f->_epfd = _epfds[idx % _io_thread_num];
        ++idx;
        for (int fd : f->_socket->fds()) {
            add_event(fd, f->_epfd, true);
            _fd_map[fd] = f;
        }
    }
}

// 保证f只有一个线程在访问
void RpcContext::remove_frontend_event(FrontEnd* f) {
    if (f->_epfd != -1) {
        for (auto& fd : f->_socket->fds()) {
            del_event(fd, f->_epfd);
        }
    }
}


// 必须在_spin_lock写锁中
void RpcContext::remove_frontend(FrontEnd* f) {
    remove_frontend_event(f);
    if (f->_socket) {
        for (auto& fd : f->_socket->fds()) {
            _fd_map.erase(fd);
        }
    }
    comm_rank_t rank = f->_info.global_rank;
    if (f->_is_client_socket) {
        _client_sockets.erase(rank);
    } else {
        _server_sockets.erase(rank);
    }
}

void RpcContext::add_event(int fd, int epfd, bool edge_trigger) {
    epoll_event event;
    event.data.fd = fd;
    event.events = EPOLLIN;
    if (edge_trigger) {
        // event.events |= EPOLLET;
    }
    //PSCHECK(epoll_ctl(epfd, EPOLL_CTL_ADD, fd, &event) == 0) << fd << " " << errno;
    ++_n_events;
    int ret = epoll_ctl(epfd, EPOLL_CTL_ADD, fd, &event);
    if (ret != 0) {
        PSLOG(WARNING) << "epoll ctl error " << fd;
        --_n_events;
    }
}

void RpcContext::del_event(int fd, int epfd) {
    if (epoll_ctl(epfd, EPOLL_CTL_DEL, fd, NULL) == 0) {
        --_n_events;
    } else if (errno == ENOENT) {
        PSLOG(WARNING) << "no such event " << fd;
    } else {
        PSLOG(FATAL) << errno;
    }
}

} // namespace core
} // namespace pico
} // namespace paradigm4